四、大模型应用开发

预计学习时间:120分钟

1. 使用系统提示词来搭建专有场景问答

  • 介绍如何利用系统提示词创建特定场景的问答应用

2. 使用 dify 快速搭建 workflow 应用

  • 演示如何使用 dify 工具快速构建工作流应用

3. 使用 Python + 框架搭建问答应用

3.1 框架一:langchain

  • 介绍 langchain 框架的基本使用方法

3.2 框架二:FastAPI

  • 介绍如何使用 FastAPI 框架构建问答应用

4. 引入外部检索信息工具

4.1 引入 web 搜索

  • 使用 tavily 接口进行 web 搜索
  • 实践演示和最佳实践

4.2 引入论文搜索

  • 使用 Python 工具 scholarly 进行学术论文搜索
  • 参考案例复现和实践

4.3 引入爬虫信息

  • 浏览器自动化技术实践
  • 信息爬取最佳实践

4.4 引入自建知识库

  • 构建简易的关键词检索系统
  • 实现标签搜索功能
  • 知识库管理最佳实践

5. 管理构建专属的知识库

5.1 多种向量库使用与推荐场景

  • 不同向量库的特点分析
  • 场景匹配与选择建议
  • 性能对比与优化

5.2 不同文件格式知识处理

A. 切片分块

  • 文件切片策略
  • 分块处理技巧
  • 性能优化方案

B. 概括(Summary)

  • 文本概括技术
  • 实现方法与示例
  • 效果优化建议

C. 实体抽取

  • 实体识别技术
  • 抽取方法实践
  • 准确率提升技巧

5.3 高级检索配置与调试

  • 检索参数优化
  • 性能调优技巧
  • 问题排查方法

6. 输出结构控制

6.1 文本自动整理表格

  • 表格结构设计
  • 自动化处理流程
  • 格式优化技巧

6.2 字幕文件翻译

  • 字幕格式处理
  • 翻译流程优化
  • 质量控制方法

7. 综合实战:Deep Research 助手工具箱

本节将通过实战项目,综合运用前面所学知识,构建一个完整的研究助手工具箱。

主要内容

  • Python GUI 界面设计
  • 功能模块整合
  • 工具箱架构设计
  • 性能优化与部署