腾讯可能找到了大模型在中国最快落地的路

  • 来源:子弹财经
  • 2023-07-08 22:50:39
分享到:
  • 收藏

出品 | 子弹财经

作者 | 语叔


(相关资料图)

编辑 | 闪电

美编 | 倩倩

审核 | 颂文

过去一年,张然被自己的工作弄得都快抑郁了。作为一家国有商业银行的信息技术开发人员,在2021年年底的时候,领导交给他一个非常艰巨的任务。

这家银行数字化全盘使用不到10年时间,之前很多的业务积攒下来的手写单据,没有进行数字化处理,在当前系统中无法查询;哪怕是全面数据化之后产生的单据,尤其是发生在贷款复核过程中,需要客户提供的发票等必须输入系统进行比对的单据,后期的复核检查不得不依靠人工处理,大大降低了相关部门的工作效率。

说实话,一开始张然还很兴奋,因为自己学习的很多新技术终于有了用武之地。然而真正接触到相关业务需求,就让他觉得这个任务变得不简单起来。

因为印花各个阶段和各种业务产生的单据都不同,最早他寄希望在OCR技术上,结果发现扫描识别的成功率不到85%,而且大量的图片细节必须需要人工处理,不但没有降低,反而增加了人工投入。后来,根据贴吧大神的说明,他又试用了云服务平台提供的识别AI相关工具,依然存在数据缺失或者识别错误问题。

这并没有达到领导对这件事的期待。对此,张然开始苦恼,甚至在工作压力下出现了失眠的情况。

直到一个偶然的机会,他接触到腾讯云的行业大模型。

1、从文本到客服

说实话,一开始听腾讯云相关技术和服务人员为他推荐的大模型解决方案,他还觉得可能跟以往云服务没什么区别。

让他没有想到的是,以往无论是OCR还是云服务产品,扫描完成的数据或多或少都需要人工审核和纠错。但经过五天五万张图片的输入与标注学习,TI-OCR大模型对于银行单据识别的效果已经超过了95%,达到银行完全可以接受的业务水平。

根据他的测算,如果系统全盘采用这个大模型作为底层,那么预计中的后期审核人工将比采用云服务工具减少70%以上,相关维护投入也将比现有纯人工的系统降低90%。

关键,腾讯云的这个大模型,还能帮助银行将所有的单据数据从非结构化转成结构化,通过对于银行内部统计报表等信息的学习,大模型能自动且准确地将扫描得到的数据,填报到内部需要的各种数据表中。

就相当于一个环节,做完了以往两三个环节才能完成的信息化工作。于是困扰了张然快一年的技术难题,就这么愉快且轻松的被解决。

(图 / 摄图网,基于VRF协议)

而能让张然这么快就爱上大模型,是因为腾讯云TI-OCR大模型的三大特点。

首先,基于原生大模型,不经过训练,直接支持常规下游任务,零样本学习泛化召回率可达93%;第二,通过prompt设计,不经过训练,支持复杂下游任务,小样本学习泛化召回率可达95%;第三,通过多模态技术,小样本精调解决传统OCR难题,自研端到端技术突破检测识别业界痛点,比传统模型召回率提高3%-20%。

基于此,张然才能游刃有余地解决问题。最终系统的效果非常好,得到业务部门和银行领导的一致好评。而他也再次感受到腾讯云行业大模型的能力。

于是,他将解决银行客服数字化和虚拟数字人客服的希望,再度放到了腾讯云行业大模型的身上。

实际上每家银行现在的业务极其广泛,由于中国多家股份制商业银行集团内部已经辐射到金融投资的方方面面。在这样的背景下,对于那些高净值的客户银行除了提供优惠的利率吸引客户以外,增加全方位的金融服务能力,是他们必须要做的选择。而金融服务能力与客户的交接点就是客服。

无论是利用社交工具,还是电话方式来回答用户的提问,甚至帮助用户处理投资上遇到的难题,客服永远都是银行系统人工投入最大的领域。如何在这方面实现减员增效,是每家银行领导都在考虑的重要问题。

当然之前张然所在银行也开发过智能客服,但智能客服的缺点也比较明显,一是情感设置比较缺乏,相关的回答让用户一看就能认出是智能机器人;二是这些回答的背后,知识图谱更新并不及时,很多时候用户能拿到的答案,要么非常死板,要么文不对题。而且智能客服转人工客服之后,人工客服还要经历一段获取信息,学习、查找再给出答案的过程,并不能给客户一个很好的体验。

因此,在腾讯云行业大模型尝到甜头之后,张然果断寻找腾讯云的帮助来解决这个问题。

很快,基于腾讯云金融行业大模型的能力,张然结合所在商业银行自身的场景数据,业务数据,还有相关集团内金融兄弟单位的能力以及业务流程连接等数据,通过腾讯云TI平台进行精调,构建了专属的金融客服大模型,并进行私有化部署。

这套大模型快速学习企业的知识文档库,搜索现有的资源和流程,同时直接对接银行的业务API,可以实现与用户无缝且包含感情的互动对话,并在银行投资、财务管理,绿色金融等方面,提供智能咨询辅助,分析决策,甚至直接引入后续业务环节的能力。

这让银行领导感到非常满意,并且已经将这套系统上报给集团,希望能在集团其他兄弟单位推广。

2、为什么是腾讯云?

其实,在金融领域,腾讯云行业大模型的能力并不仅仅是识别单据和智能客服。

针对金融企业普遍重视风控的现实,腾讯云风控大模型融合了腾讯过去20多年黑灰产对抗经验,和上千个真实业务场景,整体反欺诈效果比传统模式有20%左右的提升。企业可以基于prompt模式,迭代风控能力,从样本收集、模型训练到部署上线,实现全流程零人工参与,建模时间也从2周减少到仅需2天。

在其他方面,腾讯云的行业大模型也开始发挥作用。经过多年在产业互联网领域的深耕,腾讯云已经与众多行业领军企业紧密合作,为十个重要行业提供了超过五十个解决方案,致力于为企业提供高效、优质、低成本的人工智能应用创建和部署。

这些解决方案不仅涵盖了多种行业,例如,为智能制造提供了更加精准的预测和推荐算法,为智能金融提供了更安全、高效的智能风控服务,为智能零售提供了更个性化的商品推荐服务,而且每一个方案都由腾讯云提供的一整套模型服务工具链支持,包括高效率、高品质、低成本的应用部署工具、模型训练工具等等,这些工具可以大大提高企业创建和部署AI应用的效率和质量。

实际上,随着微软与OpenAI逐渐发力互联网广告和流量获取领域,人们发现通用大模型对于互联网业务的增量并没有太多助推作用。美国知名媒体NewsWeek最近对OpenAI旗下ChatGPT大模型应用网页统计调查显示,相关用户的热度急剧下降,其每日流量可能已经跌到一二月份热度最高时10-15%的水平。

这意味着,OpenAI大模型开发方想依赖流量广告盈利的可能性降低,商业收入受限。也因此,OpenAI的ChatGPT从3.5-4,不到三个月时间就烧完了微软投入美元100个亿,后续不得不紧急融资105亿美元应急。

从这点上看,以OpenAI为代表的通用大模型,找寻落地和商业化方面出现困难。而所有企业和开发者一致认为,行业应用应该是大模型下一阶段商业推广的重点。

7月6日,在上海举办的2023世界人工智能大会主论坛上,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生,发表演讲时表示,通用大模型有很强的能力,但并不能解决很多企业的具体问题。“企业的大模型应用需要综合考虑行业专业性、数据安全、持续迭代和综合成本等因素。基于行业大模型,构建自己的专属模型,也许是企业更优的选项”。

从这个角度看,首先在中国提出产业互联网,并一直不遗余力推动互联网技术跟产业融合的腾讯,无疑在大模型行业应用领域占据优势。

一方面,多年服务一线企业的经验,让他们在建立大模型基础后能快速根据企业的需求,调整出具备针对性的“行业模型”,能快速提供企业业务的部署,提升企业的效率。

另一方面,他们还针对企业面临的行业部署大模型可能遇到问题,提供一揽子的解决方案和趁手工具,可以加快企业部署模型以及最终产生效能的能力。

更重要的是,腾讯为行业大模型专门准备了两个强大的技术底座。

首先是星脉网络。这是腾讯云正式发布的新一代HCC高性能计算集群。该集群采用腾讯云星星海自研服务器,服务器之间采用业界最高的3.2T超高互联带宽,能提供高性能、高带宽和低延迟的集群算力。实测显示,腾讯云新一代集群的算力性能较前代提升高达3倍,是国内性能最强的大模型计算集群。

其次,就是AI原生的向量数据库。7月4日腾讯云发布的这个数据库,能够被广泛应用于大模型的训练、推理和知识库补充等场景,是国内首个从接入层、计算层、到存储层提供全生命周期AI化的向量数据库。

也因此,在国内腾讯是首先高举行业大模型旗帜的平台,也让越来越多的企业快速达成基于腾讯云行业大模型的技术变革。

腾讯云副总裁、腾讯云智能负责人、优图实验室负责人吴运声在接受媒体采访时就此表示,腾讯专注于落地实际的问题,“我们希望在每个特定场景里面100%解决客户的问题,而不是找100个产品解决70%到80%的问题,我们会聚焦找一些特定的行业跟客户深入打磨解决行业的问题,在业务流程里面用大模型的技术,结合自己自身的业务场景,还有数据相关的东西对大模型进行精调,解决他的问题。”

3、这对中国大模型意味着什么?

实际上,腾讯走的这条行业大模型先行的路,可能才是中国大模型最可行的落地之路。

因为相较于美国,开发通用大模型需要投入的算力和培训资源,国内平台的差距还是有的,需要不短时间才能追上别人水平。

就像此次世界人工智能大会的展览中,腾讯重点推出的腾讯云行业大模型解决方案。腾讯云从产业客户需求场景出发,基于大模型高性能计算集群,依托腾讯云TI平台打造模型精选商店,为客户提供MaaS一站式服务和“量体裁衣、普惠适用”的行业模型解决方案,全面降低落地门槛,助力客户构建专属大模型及智能应用。

近5年以来,中美的互联网技术发展出现了明显的分歧,从2018年腾讯930变革到如今,与产业相融合成为各家互联网企业开发产品和技术的出发点。

这意味着中国互联网企业相较于美国企业来说,更贴近于制造业和实际生产需求。所以从这样的角度来看,中国互联网企业掌握推动社会经济发展的程度会更明确。

有意思的是,大模型的成长和训练是需要大量数据的支持。目前不论是ChatGPT还是谷歌的Bard,他们都是在通用大模型领域领先。他们背后都是通过搜索引擎带来的庞大数据进行训练的,细分到具体行业,相应的数据量和数据活跃度,并没有达到用户真正的需求。

这其实才是中国企业弯道超车的真正机会。

而要想在企业端落实就必须推动行业大模型的建立和发展。中国由于人口基数庞大,在各个行业都拥有着广超美国乃至世界其他国家的数据积累,无论是医疗、法律、物流,亦或是细分行业的生产。而且这些数据在国家数据安全法的指定下,天然就具备跟海外大模型隔离的环境。

因此毫不夸张地说,这些To B端的数据是中国企业推出行业大模型最大的优势。而针对这样的优势中国大模型开发的方方面面联合起来,共同推动产业的进步,才是市场发展的基石。

吴运声一直推崇大模型时代开放的合作战略,他认为,开放是大模型发展非常重要的一个特点。因为底层的技术变化太快,而且技术外延的能力会非常广,“大模型要结合到一个行业里面,可能要花费大量的时间,这种情况下发挥最大的价值只有开放,通过开放提升让更多人加入进来,更多行业的专家,各类的角色人员加入进来,我们才能让这个生态,整个体系更加的健康,产生更多的可能性。”

毕竟,数实融合才是经济发展的真正基石,这句话,放到当下大模型异常火爆的现实中,依然具备指导意义。

从出发点来看,以高举行业大模型的腾讯为代表,中国的大模型已经具备了杀出混战的资格。

*文中题图来自:摄图网,基于VRF协议。

标签:

分享到:


精彩推送

精彩要闻

总有人要害他
资讯 2023/07/06