Telegram
Telegram Messenger 是一个全球可访问的免费即时通讯服务,支持跨平台、加密、基于云的集中式架构。该应用程序还提供可选的端到端加密聊天和视频通话、VoIP、文件共享等功能。
这个笔记本介绍了如何将数据从Telegram加载到一个可以被LangChain接收的格式中。
from langchain.document_loaders import TelegramChatFileLoader, TelegramChatApiLoader
loader = TelegramChatFileLoader("example_data/telegram.json")
loader.load()
[Document(page_content="Henry on 2020-01-01T00:00:02: It's 2020...\n\nHenry on 2020-01-01T00:00:04: Fireworks!\n\nGrace 🧤 ðŸ\x8d’ on 2020-01-01T00:00:05: You're a minute late!\n\n", metadata={'source': 'example_data/telegram.json'})]
TelegramChatApiLoader
可以直接从Telegram中加载指定聊天的数据。为了导出数据,您需要进行Telegram账户的身份验证。
您可以从https://my.telegram.org/auth?to=apps 获取API_HASH和API_ID。
chat_entity - 建议使用channel的entity。
loader = TelegramChatApiLoader(
chat_entity="<CHAT_URL>", # recommended to use Entity here
api_hash="<API HASH >",
api_id="<API_ID>",
user_name ="", # needed only for caching the session.
)
loader.load()