四、大模型应用开发
预计学习时间:120分钟
1. 使用系统提示词来搭建专有场景问答
- 介绍如何利用系统提示词创建特定场景的问答应用
2. 使用 dify 快速搭建 workflow 应用
- 演示如何使用 dify 工具快速构建工作流应用
3. 使用 Python + 框架搭建问答应用
3.1 框架一:langchain
- 介绍 langchain 框架的基本使用方法
3.2 框架二:FastAPI
- 介绍如何使用 FastAPI 框架构建问答应用
4. 引入外部检索信息工具
4.1 引入 web 搜索
- 使用 tavily 接口进行 web 搜索
- 实践演示和最佳实践
4.2 引入论文搜索
- 使用 Python 工具 scholarly 进行学术论文搜索
- 参考案例复现和实践
4.3 引入爬虫信息
- 浏览器自动化技术实践
- 信息爬取最佳实践
4.4 引入自建知识库
- 构建简易的关键词检索系统
- 实现标签搜索功能
- 知识库管理最佳实践
5. 管理构建专属的知识库
5.1 多种向量库使用与推荐场景
- 不同向量库的特点分析
- 场景匹配与选择建议
- 性能对比与优化
5.2 不同文件格式知识处理
A. 切片分块
- 文件切片策略
- 分块处理技巧
- 性能优化方案
B. 概括(Summary)
- 文本概括技术
- 实现方法与示例
- 效果优化建议
C. 实体抽取
- 实体识别技术
- 抽取方法实践
- 准确率提升技巧
5.3 高级检索配置与调试
- 检索参数优化
- 性能调优技巧
- 问题排查方法
6. 输出结构控制
6.1 文本自动整理表格
- 表格结构设计
- 自动化处理流程
- 格式优化技巧
6.2 字幕文件翻译
- 字幕格式处理
- 翻译流程优化
- 质量控制方法
7. 综合实战:Deep Research 助手工具箱
本节将通过实战项目,综合运用前面所学知识,构建一个完整的研究助手工具箱。
主要内容
- Python GUI 界面设计
- 功能模块整合
- 工具箱架构设计
- 性能优化与部署