本文档概述了大型语言模型 (LLM) 在不同行业领域的应用。重点关注针对特定行业用例进行了调整或微调的领域特定 LLM 实现,包括医疗保健、法律、金融服务、销售、内容创作和软件开发。
有关 LLM 模型和框架的常规信息,请参阅 LLM 模型和框架。有关可跨行业应用的文档问答系统,请参阅 文档问答系统。
行业应用通常需要 LLM 适应特定领域的知识和术语。这通常通过在专门数据上进行微调技术来实现。
| 优点 | 描述 |
|---|---|
| 领域术语 | 更好地理解和生成特定行业的词汇 |
| 专业知识 | 融入通用模型中不存在的领域知识 |
| 任务优化 | 针对行业特定任务优化性能 |
| 减少幻觉 | 降低领域特定内容的的事实性错误率 |
| 合规性 | 遵守行业法规和指南的能力 |
医疗领域在 LLM 的专业应用方面取得了显著的进展,从临床决策支持到医学知识获取。
来源:README.md274-278 README.md282-283 README.md989-996
MedicalGPT-zh:一个基于 28 个科室共识文本和临床指南的中文医学通用语言模型,增强了模型在医学领域的知识和对话能力。
华佗 (Llama-Med-Chinese):基于中文医学知识微调的 LLaMA 变体,旨在提高医学问答和诊断辅助能力。
ChatDoctor:一个使用包括约 700 种疾病和 5,000 条医患对话记录在内的医学领域知识,并在 LLaMA 模型上微调的医学聊天机器人模型。
来源:README.md274-278 README.md282-283
中文医学对话数据:用于训练医学对话 AI 的中文医学对话数据集集合。
Medical QA Dataset:一个包含 110 万次医疗咨询和 400 万次医患对话的综合性医学对话数据集。
COVID-19 相关数据:与 COVID-19 和其他类型肺炎相关的数据集,包括对话数据以及来自清华大学等机构的开放数据源。
法律领域的 LLM 通过理解法律术语和推理,协助进行法律研究、文档分析和合规性检查。
来源:README.md284 README.md1002-1006
LaWGPT:一系列基于中国法律知识的开源大型语言模型。
CrimeKgAssitant:一个包含 856 个犯罪相关概念的法律知识图谱项目,并在 280 万条犯罪相关记录上训练了预测模型。支持 13 种法律问答。
金融法律聊天机器人:一个基于金融和司法领域(并具备日常会话能力)的聊天机器人。
来源:README.md284 README.md1003-1005
金融行业的应用利用 LLM 进行情绪分析、投资研究和金融文档处理。
一项值得注意的应用是利用 ChatGPT 分析上市公司的市场新闻情绪。将其应用于 15 个月期的股票市场交易(期权),该方法在历史数据测试中产生了 500% 的回报。研究发现,ChatGPT 的情绪分析能力超越了传统方法,并与股票市场回报呈正相关。
开放金融数据提取工具:用于从金融文档和报告中提取投资数据的工具。
金融 NLP 研究资源:金融领域自然语言处理研究的综合资源列表。
小型金融知识图谱构建演示工作流,提供结构化的金融信息和关系,用于分析和查询。
来源:README.md983
LLM 正在极大地改变各种创意产业的内容创作流程。
来源:README.md276-277 README.md280-281
MagicSlides:一款 AI 驱动的 PowerPoint 演示文稿生成工具,可以根据文本输入创建演示文稿,支持最多 2,500 个字符。免费版本每月可创建 3 份演示文稿。
ChatGenTitle:一个在 LLaMA 模型基础上,使用数百万篇 arXiv 论文信息进行微调的论文标题生成模型。
Regex.ai:一个所见即所得的 AI 驱动的正则表达式生成器,只需选择数据即可自动创建正则表达式,提供多种数据提取方式。
来源:README.md276-277 README.md280-282
LLM 在编码辅助、代码生成以及编程语言之间的转换方面已被证明特别有效。
来源:README.md273-275 README.md279-280 README.md284
StarCoder:由 BigCode(ServiceNow Inc. 和 Hugging Face Inc. 的合作项目)开发的编程语言生成模型。核心版本 StarCoderBase 拥有 155 亿参数,支持 80 多种编程语言,上下文窗口长度为 8192 个 token。
CodeGen2:一个专注于编程和自然语言的代码生成模型。
AI Code Translator:一款利用 ChatGPT(尤其是 GPT-4)的能力,将代码从一种编程语言翻译到另一种编程语言的工具,可实现高质量的翻译。
CodeGPT:一个旨在提高编程能力的模型,在 GPT 生成的 32,000 条中文编程对话上进行了训练。
来源:README.md273-275 README.md279-280 README.md284
面向商业的 LLM 应用有助于自动化和增强从销售到客户服务的各种业务功能。
SalesGPT 是一款上下文感知的销售助手,利用大型语言模型(LLMs)自动化销售开发代表的活动,例如外展电话。它提供了一个处理外展和资格认证等任务的管道。
有几个框架和方法可以应用于多个行业,以实施特定领域的 LLM 应用。
LangChain-ChatGLM-Webui 是一个受 langchain-ChatGLM 启发的 Web 界面,它利用 LangChain 和 ChatGLM-6B 系列模型创建一个 Web UI,提供基于本地知识的大模型应用。它支持上传 txt、docx、md 和 pdf 等文本格式,并提供 ChatGLM-6B 系列、Belle 系列等多种模型文件,以及 GanymedeNil/text2vec-large-chinese、nghuyong/ernie-3.0-base-zh 和 nghuyong/ernie-3.0-nano-zh 等嵌入式模型。
行业特定 LLM 应用的未来可能会出现
来源:README.md268-286 README.md979-1006
LLM 的行业特定应用正在多个领域迅速发展,为医疗保健、法律、金融、编程等领域开发了专门的模型。这些应用利用特定领域的数据和专业知识来增强基础 LLM 在特定行业用例中的能力。预计这些应用的持续发展将对各行业的生产力和知识型工作产生重大影响。