四、大模型应用开发

预计学习时间：120分钟

1. 使用系统提示词来搭建专有场景问答

介绍如何利用系统提示词创建特定场景的问答应用

2. 使用 dify 快速搭建 workflow 应用

演示如何使用 dify 工具快速构建工作流应用

3. 使用 Python + 框架搭建问答应用

3.1 框架一：langchain

介绍 langchain 框架的基本使用方法

3.2 框架二：FastAPI

介绍如何使用 FastAPI 框架构建问答应用

4. 引入外部检索信息工具

4.1 引入 web 搜索

使用 tavily 接口进行 web 搜索
实践演示和最佳实践

4.2 引入论文搜索

使用 Python 工具 scholarly 进行学术论文搜索
参考案例复现和实践

4.3 引入爬虫信息

浏览器自动化技术实践
信息爬取最佳实践

4.4 引入自建知识库

构建简易的关键词检索系统
实现标签搜索功能
知识库管理最佳实践

5. 管理构建专属的知识库

5.1 多种向量库使用与推荐场景

不同向量库的特点分析
场景匹配与选择建议
性能对比与优化

5.2 不同文件格式知识处理

A. 切片分块

文件切片策略
分块处理技巧
性能优化方案

B. 概括（Summary）

文本概括技术
实现方法与示例
效果优化建议

C. 实体抽取

实体识别技术
抽取方法实践
准确率提升技巧

5.3 高级检索配置与调试

检索参数优化
性能调优技巧
问题排查方法

6. 输出结构控制

6.1 文本自动整理表格

表格结构设计
自动化处理流程
格式优化技巧

6.2 字幕文件翻译

字幕格式处理
翻译流程优化
质量控制方法

7. 综合实战：Deep Research 助手工具箱

本节将通过实战项目，综合运用前面所学知识，构建一个完整的研究助手工具箱。

主要内容

Python GUI 界面设计
功能模块整合
工具箱架构设计
性能优化与部署