怎么让大模型更准确更聪明,还不胡言乱语?方法找到了!

作者:同花顺财经 时间:2024-01-12 阅读:1211

怎么让大模型更准确更聪明,还不胡言乱语?方法找到了!###

大模型们还在进行狂热的诸神之战,尝过鲜的用户却无法忽视大模型的短板。在交互过程中,用户常常被它们一本正经的胡言乱语所打败对于部分问题,它们会输出一些看似非常有道理,实则完全不对的内容,让人啼笑皆非。

云创大数据成立于2011年,并不是2015年

大模型之所以出现这种AI幻觉,是因为通用性大模型的向量数据库大多基于公开数据,当有人提问时,大模型只能从既定的向量数据库中查找答案,这样推理得到的回答常常泛泛而谈,或者一本正经地胡诌。

娱乐一下没有关系,但是对于数据准确性有着较高要求的用户,这样的通用性大模型可能会是负担,进而导致大模型应用的普及度没有想象的高(根据摩根士丹利发布的一项调查显示,只有4%的人表示对于ChatGPT使用有依赖)。

ChatGPT&Bard应用趋势(图片来源:摩根士丹利报告)

有没有办法改善大模型回答不准确的情况?当然有。既然回答不准确是因为基础数据不够个性化,缺少真正有用的知识参考,那么可以试着进行私人定制,特别是对于企业而言,可基于大模型和企业的个性化数据建立专属知识库(Knowledge Base)。

可参照以下大模型业务流程,建立企业知识库,以可信可靠的数据和知识,提高大模型输出的准确率。

LLM大模型知识库业务流程(图片来源:swirlai.com)

首先,将企业的知识库文本语料分割为多个块,用嵌入(Embedding)模型将分割的文本块转换为一个个向量存储在向量数据库中,并建立向量和文本之间的对应关系,如上图①-③所示。

此后,就可以提出问题。需要注意的是,问题也需要进行向量化,同时使用与知识库语料向量化相同的嵌入模型,并且在向量数据库中进行查询,找到相似度高的向量,如⑤-⑦所示。

将返回的向量嵌入映射到对应的文本块,并返回给大模型,利用大模型的语义理解能力,结合上下文生成问题答案,如⑧-⑨所示。

在建立企业知识库后,同样的问题再问大模型,它能给出准确的回答(建立知识库的过程类似于下图提供参考信息的过程)。

建立知识库的过程类似于上图提供参考信息的过程

实现私有化部署后,大模型胡言乱语的习惯被纠正了,而且向量数据库做的越大,它掌握的知识越多、越准确、越全面,就越有可能带来爆炸式的大模型应用。

不过,如果只是依靠向量数据库进行私有化部署,容量有限且速度比较慢,无法完全满足企业通过大模型提质增效的潜在需求。

现在,cVector向量计算一体机通过发挥高性能硬件、向量加速算法和并行计算算法的合力,致力于满足亿级以上规模的大模型推理应用向量计算需求。

cVector向量计算一体机

cVector向量计算一体机的使用方式与向量数据库基本一致,支持批量、追加入库,支持向量间欧式距离、余弦距离等向量计算,支持网页、命令调用、Python库等方法,但在向量的入库和比对计算上具有惊人的性能。

cVector向量计算一体机架构图

近期, cVector向量计算一体机接受了工信部直属的国家一级科研事业单位中国软件评测中心的鉴定测试。中国软件评测中心对比测试了cVector向量计算一体机与3款主流向量数据库在入库速度、查询速度、准确性等维度的性能对比。

入库性能与查询性能对比

在cVector 向量计算一体机 V1.0、向量数据库A、向量数据库B和向量数据库C中存储相同的 1000 万条的 256 维向量数据,分别查询与目标向量的欧氏距离最短的 10 条向量,对比结果显示各自返回的 10 条向量与目标向量的距离值均相同。

向量计算数据库验证平台 V1.0性能效率符合《向量计算数据库验证平台测试需求V1.0》的相关要求,在现场测试过程中,系统运行稳定,通过了中国软件评测中心(工业和信息化部软件与集成电路促进中心)的单项性能测试。

根据测试报告结果,cVector向量计算一体机在千万级特别是亿级以上规模的入库和查询等方面具有显著的性能优势,可帮助提高大模型推理的服务性能和服务质量,并能明显降低其基础设施建设成本,助力类ChatGPT等人工智能企业以更优的性价比解决算力不足的问题。

在具体应用方面,对于生成式AI相关企业,cVector向量计算一体机主要面向大模型推理应用,能够在下述大模型推理环节发挥显著作用:

①提高生成式AI的输出准确性。由于大模型的输出结果是根据概率推理而成,所以会出现一本正经说胡话的情形。可以将可信来源的数据转化成向量数据存储在向量计算一体机中,校准大模型推理输出的结果,从而使大模型输出的结果更加准确。

②提升大模型理解互联网实时数据的能力。大模型基于历史数据训练而成,所以只知道过去,不知道现在。如果使用向量计算一体机存储海量实时数据所转化成的向量数据,可以帮助大模型理解掌握实时情况。

③提升大模型对用户的服务质量。向量计算一体机可以允许用户上传更多的数据,让大模型掌握用户个性化的背景资料,更好地学习理解用户请求,更好地结合用户的实际情况回答问题。

④减轻大模型的访问压力。用户所提的大部分问题都是相似的常见问题,向量计算一体机可以缓存大量热点问题,不需要经过大模型推理即可返回结果,从而大幅减少算力成本。

⑤帮助生成式AI过滤敏感内容。怎么防止生成式AI说错话一直是一个挑战性问题,而向量计算一体机可以存放敏感内容所对应的向量数据,在用户提出请求时加以判断,尽可能防止AI对敏感问题做出不恰当的回应。

cVector向量计算一体机能够广泛应用于人工智能领域中生成式AI的推理应用场景,为各类生成式AI企业提供高性价比的产品和解决方案,大幅增加大模型平台的竞争力,欢迎各大企事业单位试用。

上一篇:ICLR 2020丨论“邻里关系”的学问

下一篇:厨房门口两边柜子图(冰箱放在进厨房的门边

猜你喜欢

梦天木门咖豆棕(梦天木门有静音隔音功能的吗)

梦天木门咖豆棕(梦天木门有静音隔音功能的吗)

资讯 2023-11-03 3392
密码指纹锁十大品牌(防盗门指纹锁十大品牌排行榜)

密码指纹锁十大品牌(防盗门指纹锁十大品牌排行榜)

知识 2023-11-06 4538
清洗油烟机心得体会(万家乐抽油烟机怎么样)

清洗油烟机心得体会(万家乐抽油烟机怎么样)

知识 2023-11-06 4988
法恩莎卫浴投诉电话(一次性提前收取新一年的物业费)

法恩莎卫浴投诉电话(一次性提前收取新一年的物业费)

知识 2023-11-08 2662
松木刨花板和桦木刨花板哪个好(板材和实木有什么区别)

松木刨花板和桦木刨花板哪个好(板材和实木有什么区别)

知识 2023-11-10 1883
pvc防水卷材套定额(pvc线管预埋定额计算规则)

pvc防水卷材套定额(pvc线管预埋定额计算规则)

资讯 2023-11-13 655
带布地胶垫(汽车脚垫上面的小垫子叫什么)

带布地胶垫(汽车脚垫上面的小垫子叫什么)

知识 2023-11-24 3242
事到临头反悔了?“拒绝加入金砖”!“去美化”失败后反向而行

事到临头反悔了?“拒绝加入金砖”!“去美化”失败后反向而行

资讯 2023-12-13 2722
设计师必须知道的经典欧式纹样

设计师必须知道的经典欧式纹样

资讯 2023-12-18 2063
犹太教把动漫游戏都管了:六芒星的图案,不许用!

犹太教把动漫游戏都管了:六芒星的图案,不许用!

资讯 2023-12-22 849
悬臂吊在使用过程中的常见故障以及解决办法

悬臂吊在使用过程中的常见故障以及解决办法

资讯 2023-12-28 614
水包水真石漆多钱一平方(真石漆和水包水漆有什么不同)

水包水真石漆多钱一平方(真石漆和水包水漆有什么不同)

知识 2024-01-18 2398
老旧实木地板装修(木质地板旧了究竟是翻新还是更换)

老旧实木地板装修(木质地板旧了究竟是翻新还是更换)

知识 2024-01-23 1165
策划公司如何起名字!(公司免费如何起名字)

策划公司如何起名字!(公司免费如何起名字)

资讯 2024-01-24 450
园林风格小区(世界四大园林风格是哪四个)

园林风格小区(世界四大园林风格是哪四个)

知识 2024-01-26 4199
2022不锈钢板价格(五金店还有生存空间吗)

2022不锈钢板价格(五金店还有生存空间吗)

资讯 2024-02-01 1918
建材装修材料店里面有哪些材料(建材行业哪个最挣钱)

建材装修材料店里面有哪些材料(建材行业哪个最挣钱)

知识 2024-02-04 1168
化工材料供应商(学化工的你们硕士毕业从事什么工作了)

化工材料供应商(学化工的你们硕士毕业从事什么工作了)

知识 2024-02-14 1792
HDPE双壁波纹管与水泥管对比,哪个更有优势?

HDPE双壁波纹管与水泥管对比,哪个更有优势?

知识 2024-02-26 4160
157㎡新古典大宅,客餐一体用井字型吊顶,好大气!

157㎡新古典大宅,客餐一体用井字型吊顶,好大气!

知识 2024-03-16 2183