ReadTheDocs 文档
Read the Docs 是一个开源的免费软件文档托管平台。它使用
Sphinx
文档生成器生成文档。
本文档介绍如何从作为 Read-The-Docs
构建的一部分生成的 HTML 中加载内容。
有一个实际示例,请参阅 这里。
假设 HTML 已经被抓取到一个文件夹中。可以通过取消注释并运行以下命令来完成此操作。
#!pip install beautifulsoup4
#!wget -r -A.html -P rtdocs https://langchain.readthedocs.io/en/latest/
from langchain.document_loaders import ReadTheDocsLoader
loader = ReadTheDocsLoader("rtdocs", features='html.parser')
docs = loader.load()