转型升级,不断前行

TRANSFORM, AND KEEP MOVING FORWARD

大语言模型行业落地展望

来源:贝博足球app平台    发布时间:2024-09-03 06:00:11

  大语言模型的突破与古腾堡印刷术的发明相比。古腾堡印刷术是15世纪中叶由Johannes Gutenberg发明的革命性印刷技术。其核心是可移动金属活字和新型印刷机的使用,这使得书籍的生产速度大幅度的提升,打破了教会对知识的垄断,促进了文艺复兴时期的知识传播和学术研究,也为新闻、宗教改革和科学研究的发展奠定了基础。

  大语言模型在互联网问世30年后,通过无标注学习海量数据,实现了对人类语言的模仿,成为一种预测能力。计算能力的飞跃和GPU芯片的并行计算能力推动了大语言模型的发展。它有潜力改变人类的生活,使知识获取更便捷,降低知识生产所带来的成本,改变我们获取知识的方式。在商业方面,它能重塑服务业和制造业。

  目前,服务业的劳动生产率较低,即使通过服务外包来减少相关成本,服务效率也没有明显提高。借助专门训练的大语言模型,高级律师可以在保持或减少相关成本的前提下,处理更多的业务量,提高服务业的效率。这种变化可能会影响所有以语言为基础的行业,包括客服、心理咨询、课外辅导和上市公司审计等领域。

  OpenAI推出ChatGPT已有10个月,全球商业精英已在探讨其对行业的影响。报道称,安永等先行者已投资14亿美元于AI领域,成为最新一家对这项快速地发展的技术投入巨资的公司。除了14亿美元的投资,这家专业服务企业还创建了自有大语言模型EY.ai,并计划为其40万员工提供AI培训。面对这种变化,商业领域应如何应对?

  大语言模型首先将影响那些高度依赖语言的行业和职业。以下九种职业可能首当其冲:平面设计师、笔译员和口译员、制造和装配线工作、数据输入和数据处理、客户服务和支持、校对员和文案编辑、市场研究分析师、财务规划师和税务师和初级软件开发人员。

  不同行业可以建立一个基本分析框架:公司成本中语言的比例有多少?比例越高,使用大语言模型提升效率的潜力就越大。例如,考虑一个电商销售公司,我们应该评估售前、售后人员、美工、文案和物流协调的开支占总成本的比重,因为这些岗位高度依赖文字交流、语音通话和视频展示。同时,还需考虑员工素质培训、流动性及监管变化带来的潜在成本。这样,企业家可以更容易地决定是不是在公司运营中引入大语言模型。

  需求客观存在,但目前的技术能力是不是足以满足需求仍是一个问题。尽管这是一个非常令人兴奋的创业方向,但它也充满了巨大的技术和商业风险。

  国内更多讨论基座模型,而国外的创业热潮大多分布在在运用领域,因为大模型技术仍有一段距离。目前,基座模型有开源和闭源两个方向。比如,Meta的LIama2模型是开源的,而OpenAI的GPT-4是闭源的。模型公司选择开源或闭源其实就是商业模式的不同选择。开源模型能够最终靠商业授权、订阅、物理捆绑、技术上的支持服务、专有插件和扩展等多种方式收费。闭源系统则更倾向于创建一个完整的生态系统,由一家主要供应商整合资源来服务各类客户并获利。目前还不清楚大语言模型领域是否会出现一个类似移动互联网时代苹果的闭源生态企业,因为基座模型的竞争很激烈,一些开源模型在多项评测中已超越GPT-3.5。然而,目前GPT-4仍是行业中最领先的模型。如何结合基座模型的优势和运用开发是一个巨大的挑战,同时也受到监管和商业伦理的限制。虽然OpenAI推出的第三方插件目前尚未成功,但其最新的数据分析功能展示了它在运用领域的巨大优势。

  国内大多数围绕大语言模型的勇于探索商业模式的公司都将重点放在运用方面。目前已有许多中文基座模型,包括基于国外开源的Llama, Falcon等模型进行微调的中文模型,这些模型表现也很优秀。因此,国内企业至少有两个选项:选择国内提供的中文基座模型或选择微调过的开源中文基座模型。我们大家都认为国内基座模型竞争不仅仅是商业竞争,政府监管也扮演了重要角色。

  国内企业,无论是TOB还是TOC,都有巨大的发展空间,这里主要讨论TOB。目前的技术探讨研究大多分布在于解决大语言模型的固有问题,包括信息的真实性、时效性和稳健性。这方面的技术前沿可以在Arxiv预印本论文网站和Github代码库中找到。国内创业者在这样的领域具有非常明显的技术优势,很多领先的研究论文都有中国学者的参与。行业应用必须有实际的使用场景,比如零售商的客服和物流调度,律师事务所的文件审查,智能零售货柜的自然语言购物等。这是一个待开发的蓝海市场,国内企业通过选择正真适合的技术路线和考虑成本效益,具有非常明显的优势,可以在中文环境中率先实现大模型的落地。在这方面,国内科技初创企业与国际同行实际上处于同一个起跑线 突破的契机何在?

  我们认为突破的契机需要供需双方的共同努力。目前需求方对大语言模型的运用抱有高期望,但也存在许多疑虑,大多分布在在技术成熟度和总成本上。虽然供应方已尝试多种技术路径并提出了许多原型产品,但往往缺乏实际的落地应用场景。这正是需要企业家精神的时刻,需要有行业领先者勇于尝试和接受可能的失败。

  为促进大语言模型行业的落地,现在是一个最佳时机,因为技术总体已经相对成熟,虽然仍存在一些技术问题和不达预期的风险,但相对于潜在的投入产出比,风险已经比较小。企业和创业者应该深入研究现有的技术和行业趋势,结合实际应用场景来探索和实现大语言模型的落地。