中科闻歌:场景驱动企业级决策大模型价值绽放
人工智能(AI)是发展新质生产力的重要引擎,AI辅助认知和决策领域的市场潜力巨大。为解决认知与决策智能领域的重大产业缺口,中科闻歌顺势而为,致力于场景驱动型企业级决策大模型的研发与应用。中科闻歌依托创立初期的平台与系统探索,成功将其应用于公共场景,再拓展至头部企业,实现了多元场景化应用。面对通用大模型带来的挑战和短板痛点,中科闻歌自主研发企业级决策大模型雅意1.0,逐步演进至2.0,赋能政府、企业及个人的智慧决策。未来,中科闻歌也需拥抱新挑战,以创新引领AI由感知向决策的范式跃迁。
文 / 尹西明、朱益瑶、苏雅欣、李纪珍
以人工智能(AI)为代表的颠覆性技术,正加速重塑生产、生活和社会结构,其在感知、认知、决策及执行等环节的应用,是效率革命和新质生产力持续涌现的重要引擎。自2023年初OpenAI发布的ChatGPT“出圈”爆火后,人工智能行业进入以生成式人工智能(GenerativeAI,简称GenAI)大模型为代表的新一轮突破性发展阶段,国内外企业纷纷积极抢占大模型发展先机,持续投入且成果频频。在技术快速发展的同时,AI产业也面临新的机遇与挑战。大模型尚处于从感知AI向决策AI演进的关键时期(见图1)。感知智能已取得成熟应用,认知智能正在加速商业化进程,而决策智能由于能够进行复杂的决策制定,为传统产业智能化升级提供更直接的驱动力,完成职业增强或替代从而实现降本增效和产业跃迁。以平台为中心的决策智能将成为AI技术研发与成果落地的新兴趋势。
此外,大模型在多数领域尚不能实现对小模型的完全替代,大小模型将长期并存且相互融合,形成互补优势,共同推动产业智能化发展。“一场景一训练一模型”的定制化需求在企业运营的特定环节也发挥着重要作用。AI企业亟需深入探索和突破辅助决策的大模型,并面向特定场景把模型做“小”,精准辅助企业智慧决策。
因此,瞄准AI产业发展缺口与企业转型重大场景问题,中国科学院自动化所互联网大数据研究中心于2006年成立后,聚焦大数据与AI基础研究与技术积累,并在2017年由团队带头人曾大军和王磊、罗引博士联合创立北京中科闻歌科技股份有限公司(以下简称“中科闻歌”),致力于学术研究向产业化赋能的探索。
在学术创业到企业成长过程中,中科闻歌深刻把握数据智能向决策智能的发展趋势,以场景应用为牵引,依托数据操作系统“闻海”、领域大模型“雅意”、决策引擎“天湖”等产品,围绕认知与决策基础平台DIOS,创新AI技术与复杂场景适配的工程技术方法,结合领域专业知识构建了“模型算法—行业理解—场景应用”的完整体系,面向媒体宣传、城市治理和金融等多领域打造高效、经济的轻量化企业级大模型,提供大数据与AI基础平台与解决方案,实现了大模型技术与应用场景的深度融合,成为场景驱动企业级大模型价值绽放的典型(见图2)。
截至2023年底,中科闻歌已服务政府和企业客户千余家,在媒体、社会计算、治理、金融等多元化场景落地应用,逐步建立起以头部企业为核心、向产业链延伸拓宽的生态体系。公司有40多位博士团队,研发人员占比逾70%,基础能力研发人员占比超过30%,拥有核心专利和各类软著专利等自主知识产权一百余项,已发表六百余篇论文,自主研发核心算法数千个,相关科技成果获国家及省部级荣誉二十余次,产品竞争力得到行业和国家的认可。2021年,中科闻歌入选工信部第三批专精特新“小巨人”企业,2022年,“红旗”多模态融媒体数据智能分析平台荣获2022数博会领先科技成果奖,2023年,中科闻歌荣获“2023直通乌镇”全球互联网大赛二等奖。2024年,在赛迪研究院发布的《2023中国人工智能大模型企业综合竞争力50强研究报告》中,中科闻歌独立研发的雅意大模型位列第19名。在资本市场上,中科闻歌也颇受瞩目,截至2023年底,已累计完成6轮超十亿元融资,获深创投、中科创星、中国科学院资本、金科君创、国开金融等多家知名投资机构投资。
十年潜心科研后,三位联合创始人为何选择走出象牙塔,从学术科研院所走向市场?深耕认知与决策智能的中科闻歌何以在AI大模型的激烈竞争中站稳脚跟,实现场景驱动的企业级大模型价值绽放与创新发展?未来中科闻歌又该如何把握技术和产业变革新机会,做优做强并走向世界舞台?作为认知与决策智能的先锋探索者,中科闻歌技术与场景的创新融合探索不仅具有重要的管理启示,更为场景驱动AI创新与赋能新质生产力发展提供了新模式。
创业探索:面向重大场景问题驱动人工智能学术创业
十年基础研究,技术之基稳筑成
自2006年起,中国科学院自动化所互联网大数据研究中心经过十余年发展,形成了一支由曾大军研究员为领头人的科研团队,深耕于安全信息学和社会计算领域。闻歌的三位联合创始人均是中国科学院自动化研究员,董事长王磊博士在自动化所积累了十余年的丰富经验,入选全国青年岗位能手与海英人才计划;首席执行官罗引博士入选北京市科技新星计划;首席科学家曾大军教授是中国科学院自动化所副所长,不仅是安全信息学科的创立者,更是社会计算研究的主要推动者。高管团队也大多拥有超过十年的研究积累。十年沉潜,团队在大数据与AI领域基础研究中取得突破,也积累了丰富的技术经验和项目管理能力,使得中科闻歌创业团队构筑起人才与技术的双重壁垒,成为认知与决策智能领域的国家队。
启航媒体场景,平台系统初建成
2017年3月,中科闻歌正式成立,王磊任董事长,罗引担任CEO,公司定位于AI知识与决策智能平台型企业。中科闻歌团队的学术创业背后离不开体制机制改革的支持。“国家允许科研人员保留科研岗位离岗创业,为把科研‘点’上的突破连成‘面’上的产品应用提供了机会,产业化平台中科闻歌也是在此背景下孵化而生”,中科闻歌执行总裁曲宝玉说道。
创立伊始,中科闻歌在主营业务领域的选择遵循三大核心原则。一是紧密围绕国家重大发展战略,特别是智能认知与决策等受到国家政策大力支持、对构筑国家竞争优势起到关键作用的AI新兴产业。二是紧密关注前沿科技趋势,重点聚焦AI大模型等关键领域,瞄准产业发展缺口,抢抓未来产业先机。三是感知倾听市场的声音,以场景需求为依据精准定位业务方向。
2017年,互联网和新媒体迅猛发展,传统媒体面临巨大转型压力和挑战,迫切需要新兴数字技术以加快传统媒体向新媒体融合转型。闻歌看中了媒体行业的巨大发展潜力,率先将战略目光聚焦到泛媒体行业,主要面向中央和地方媒体推广成熟的媒体大数据产品,同时辐射对媒体内容、传播影响有需求的政府和企业市场。2017年,中科闻歌的相关产品已在工信部、海关总署、新华社、招商银行、比亚迪等五十余家政企客户得到广泛应用和检验,奠定了创业发展基础。2018年,中科闻歌又推出认知计算驱动的大数据产品——深度超级智算平台“天湖”和全球多语言泛媒体大数据平台“闻海”,赋能政企客户实现人机共融智能决策,将数据要素转化成商业价值。
拥有技术底座与前期在媒体领域沉淀的政府客户资源,中科闻歌进一步提出基础平台赋能泛行业的设想,应用场景从媒体领域不断拓展,面向数智媒宣、数智城市、数智金融与税务、数智商业四大场景和二十六个细分行业提供产品和解决方案,抓住时代机遇,迎潮而上。
平台系统布局,政企客户深应用
以初期的“闻海”“天湖”为能力基座,中科闻歌又将场景与技术结合,实现平台产品的场景化,推出领域AI系统应用。如面向媒宣场景的“红旗”融媒体平台、面向社会计算场景的“晴天”多模态信息分析平台、面向金融场景的“天镜”金融知识图谱平台等。此外,中科闻歌注重人才的多元化,围绕“产品化”“市场化”对人才实施精细化管理,强化技术思维与市场思维的融合,并不断完善市场化营销体系的搭建。凭借在政府客户中积累的经验与口碑,中科闻歌开始面向商业化场景,逐步从G端向B端企业客户拓展,服务支撑九十多家央国企单位,一千多家大中型企业,覆盖银行、券商、基金、教育等多个领域,并通过企业客户的拓展反哺企业工程化与产品化能力,逐渐形成成熟的商业模式。
创新突破:面向AI场景化难题推出企业级决策大模型
AI大模型凭借其卓越的理解、记忆、生成和泛化能力,带来了“基础模型+各类应用”的新范式,为产业智能化拓展了新空间。然而,目前通用AI大模型普遍面临算力成本高、算法“黑箱”、 难以商用化或私有化部署、高质量领域数据缺乏和专业知识弱等制约产业发展的痛点。因此,瞄准大模型量产和能力复用瓶颈,闻歌选择不唯参数规模,做“小”做“精”做“深”大模型,打造更高效、更经济的轻量化企业级模型的发展路线,以期实现“AI赋能百行千城万企”的美好愿景,并于2023年6月3日发布企业级专属大模型——雅意。
自主研发,技术筑基
中科闻歌是社会计算和安全信息学领域的主要推动者,在深度语义理解、领域社会计算方面拥有多项核心专利。在AI工程创新方面,团队基于可控内容生成、主动学习和多模态思维链学习技术,研发出安全可控的企业级雅意大模型和DIOS认知与决策基础平台,提升了模型与系统的可信度和可解释性。
闻歌还通过开发具有自主知识产权的“知识与决策”技术谱系,掌握了感知—认知—决策的全链路技术。在决策层面,公司研发的多模态知识融合决策技术,能够有效整合数据与知识资源,支持场景驱动的决策制定。在认知层面,多模态内容智能生成技术能够生成高质量的文本和视觉内容;此外,智能理解技术能够进行跨模态的语义分析、信息传播的追踪与溯源等。在感知层面,泛媒体数据管理技术具有强大的数据管理和服务能力(见图3)。
雅意大模型自首发以来,经过持续迭代,于2023年12月发布拥有数据、模型、应用全自主知识产权的2.0版本。相较于1.0,雅意2.0大模型的参数规模、词表与上下文窗口均得到显著扩展,支持128k长文本阅读和多轮对话,还支持多模态智能交互和智能插件调用。通过大量实验证实,其整体性能显著优于同参数级别的开源模型,在多项评测榜单排名前三,成为企业优化资源配置、科学决策的有效工具,帮助客户实现降本增效。
可信语料,可靠模型
语料库是大模型训练和优化的“养料”, 然而,当前我国AI发展所需的高质量语料数据相对匮乏,还存在数据不完整、标注不一致、更新不及时、信息不准确甚至违法的语料安全问题。所以,拥有安全可靠的训练语料对国产大模型来说尤为重要。中科闻歌与北京智源研究院等单位合作,共同建立“中文互联网语料库”(Chinese Corpora Internet,简称 CCI)。该语料库的数据来源于中国境内高质量可信的互联网站,经过严格的数据清洗和去重处理,同时在内容质量和价值观等方面进行针对性检测和过滤,以提升数据质量和安全可信程度。开源可信中文互联网语料库CCI的建立不仅是中科闻歌自主探索的典型案例,还有助于雅意大模型的训练和应用。
在训练语料方面,雅意大模型基于240TB多源基础数据,一千余道数据清洗工序,实现将冗余、高困惑度、低信息熵、涉及个人隐私、与主流价值观不符的数据进行有效去除,最终萃取出2.65万亿Tokens高纯度高质量预训练数据集,确保训练数据语料的安全可控。
在应用模式方面,雅意大模型支持数据私有化部署,并能根据企业特定需求进行定制化专属训练,以满足客户对业务数据保密性和数据所有权的高要求。为简化企业的技术门槛,中科闻歌还推出基于雅意大模型的智能软硬件一体机,定期更新模型版本并远程协助企业完成迭代优化。此外,雅意大模型还提供API接口和SaaS账号服务,使企业低门槛、低成本、高效率地集成AI技术。将模型与企业数据紧密结合构建出高度可用的智能服务,既满足企业的业务需求,又能防止敏感数据泄露,为企业的智能化转型升级提供有力支持。
深耕场景,能力生长
不同行业具有复杂且差异化的知识结构和庞大的信息量,面向垂直场景的领域大模型成为激活和发挥数据潜在价值的关键工具。雅意大模型作为企业级专属大模型,经过多轮迭代测试,已经形成包括实时联网问答、领域知识问答、多语言内容理解、复杂场景信息抽取、多模态内容生成的五项核心能力,以及一百多个特色技能(见图4)。在这些通用能力之上,中科闻歌将业务触角延伸到GI(政府智能)和BI(商业智能),专注于媒体创作、智慧金融、社会治理等关键领域,大幅提升模型精度,可快速对接政府、企业数据并一键生成大模型专属应用服务。雅意大模型在多个领域中落地,其核心竞争力在于将技术与场景结合,获得丰富的领域深度认知,持续沉淀和催生新能力。
作者已有研究提出,对行业发展的具象化认知会帮助企业获得更多场景知识和经验积累,并通过互动反哺产品研发的连续性,增强技术与商业模式创新结合的紧密度。
中科闻歌十年来扎根多个行业深入学习,通过早期研发的大数据平台在行业和头部企业的应用中积累产业数据资源,获得了独特的行业“know-how”。其对行业发展趋势拥有具象化认知,能够更加敏锐地感知外部信息,准确把握行业发展趋势,并与行业生态中其他参与者增加互动,从而保持与行业的紧密结合。这种紧密结合有助于深入了解客户需求,并注重开发满足用户需求的产品,以缩小技术与应用场景之间的差距。雅意大模型针对特定领域需求如数据库、语料库、知识库进行训练和优化,通过深入领域场景知识的萃取和领域专家的反馈调优,提升应用专业度与行业客户满意度。技术能力与领域知识的融合,不仅使得雅意大模型能够更好地满足客户需求,也为公司在激烈的市场竞争中赢得了先机。未来随着对行业理解的日益深入,雅意大模型有望在更多场景中实现应用落地,创造更多下游任务。领域工程聚焦于将行业模型参数规模做小,决定大模型落地到行业的效果。雅意大模型通过缩减参数规模,在企业级应用中更加精准高效,成为“大模型之上的模型”。
价值绽放:场景驱动企业级大模型落地
目前,场景驱动创新成为AI产业发展的重大范式机遇。作者已有研究提出,场景驱动创新强调从场景中的复杂综合性需求出发,超越技术驱动的线性逻辑,能够整合协同多种创新要素,高效匹配技术与场景,破解AI技术创新与产业化瓶颈。AI科技企业亟需以人工智能技术与产业融合创新为导向,聚焦产业智能化场景创新需求,推动创新进程中多层次、多主体、多功能以及多要素的融合,最终实现应用迭代和创新跃迁。基于场景驱动创新研发与应用,中科闻歌在雅意2.0基础上,推出以安全可靠为核心特色的企业级大模型体系,面向媒体、金融、政务等场景构建行业大模型应用。
媒体场景:大模型+平台提升决策力、生产力、创造力
在媒体场景,雅意大模型已搭载在中科闻歌红旗融媒体智能平台,可提供选题决策、辅助写作、多模态内容生成、内容安全审核等服务,赋能媒体融合创新发展。雅意大模型与闻海媒体大数据相结合,基于全网热点传播数据进行自动智能分析,辅助用户发现选题线索并快速了解报道核心,提升选题决策的质量和效率。此外,红旗平台的AI辅助创作功能,如自动生成大纲、自动写作和绘图,简化了内容创作的过程,提高了生产力和内容质量。
“雅意大模型在服务党政媒体、行业媒体、企业级媒体的决策力、生产力、创造性方面,起到了非常好的支撑作用”,闻歌数智媒宣事业部总经理王一刚表示,“雅意大模型是具有主流价值观的安全大模型,让媒体人使用得更放心。”
金融场景:大模型助力金融企业决策精准高效
为解决企业端信贷的风险控制问题,中科闻歌为北京银行定制基于大模型的AI训练平台,能够实时微调风控模型。此外,AI训练平台还能利用大模型提供企业信贷尽调报告生成服务,更加准确地评估客户的信用情况,使贷款决策更为精准快速,极大提高工作效率。面向VC/PE业务场景,中科闻歌正在为某头部投资机构开发可在本地化部署的AI平台。该平台通过大模型技术处理和分析用户的历史投资数据和相关文档,自动产生结构化的投资报告,并提供自动问答功能,极大节省投资人员阅读文档的时间,提升投资决策的效率和精准度。
中科闻歌还联合某大型券商开展内容合规审核服务的研发,利用大模型验证研报信息的准确性和来源,排查敏感信息和虚假内容,并高亮显示研报中的政策或观点沿用情况,有效提升证券的财经内容管理效率,确保发布观点的快速性、一致性和准确性。
中科闻歌的企业级大模型还助力监管机构高效监控上市企业的外部宣传合规情况。通过大模型自动识别并标注可疑违规信息,随后由人工复审确认,辅助监管机构快速做出响应。基于大模型的内容合规审核服务既可以为企业提供保护,成为企业的“盾”,同时还便于监管机构规范市场,保护投资者利益,成为监管机构的“矛”。
政务场景:大模型+平台赋能信息决策
依托雅意大模型技术能力,中科闻歌全面升级“晴天”大数据洞察平台,目前已为新华社、北京冬奥组委、中建集团、中信银行等政府或企业头部客户,提供全媒体、多模态的舆情信息监测和传播影响力分析等服务,帮助客户实时感知数据,深度洞察数据价值。
针对网上突发的热点事件,在短时间内可快速生成包含事件概要、舆情热点、各方观点反应、舆情风险的报告,有效支撑舆情应对决策制定。同时,平台支持网站、新媒体、短视频等全渠道监测,提供智能搜索、一键翻译、可视化深度分析等服务, 还可7*24小时全渠道自动巡查、预警,帮助用户及时掌握舆情动向,做出有效应对。
大模型的场景化应用培育创新生态飞轮
人工智能产业以算力、算法、数据为核心支柱,其中“算力”依赖基础性研究开发 ,“算法”聚焦知识学习和技术创新,“数据”汇聚于场景生态。由此可见,大模型的场景化应用源于基础研究,落于需求场景,关键在于科技创新与成果转化,核心逻辑在于以技术赋能新业务、新业态和新产业,再以场景驱动技术优化迭代,打造创新生态飞轮,引领产业智能化跃迁。
其中,基础研究是形成前沿技术优势的根本途径,是技术工程问题的总机关。只有持续做强基础理论研究,不断激活原始创新的源头活水,才能为科技自立自强夯实根基,为科技强国建设打牢地基。中科闻歌依托核心团队成员十年的基础理论研究、技术和能力积累,开始了其学术创业征程。自2006年起,闻歌一直专注于领域大数据理解和AI创新赋能。自2012年开始,闻歌敏锐把握机遇,积极与中宣部、新华社等政府客户合作,以泛媒体行业为市场切入点,迅速在全国范围内树立起了显著的品牌影响力。通过技术的迭代,对技术的应用形成了正循环,随后,逐步将业务重心由媒体场景延伸至社会治理、金融等领域,实现从单一头部政府客户到广泛B端企业客户的拓展,覆盖20多个行业,近千家企业级客户,形成了广泛的行业头部客户积累。
随着场景的拓展,中科闻歌又逐渐构建平台能力,基于“闻海”“天湖”等基础数据平台,推出行业级AI系统应用,形成DIOS认知与决策智能基础平台,使平台系统建设不断完善。中科闻歌在业务场景中不断成长,深化对行业的理解,与政企客户建立长期且紧密的合作关系,共同创造价值。政企客户从高质量的领域数据资源和海量的应用场景方面给予中科闻歌支持,中科闻歌所提供的数据平台与配套服务直接赋能政府和企业降本增效。
此后,面对大模型快速发展的新机遇,中科闻歌抓住了大模型这一突破口,依托多年行业深耕所获得的领域专业知识和高质量数据资源,将其作为AI大模型语料训练的“养料”,迅速建成了安全可靠的企业级大模型“雅意”。
场景驱动创新既是将现有技术、数据、产品和服务应用于特定领域或场景,实现更大价值的过程;更是基于未来趋势,以批判性思考和想象力建构和解析未来场景,凝练科学问题,发现颠覆性技术创新机会,突破现有瓶颈,创造新技术、新产品乃至开辟新市场、新领域的过程(尹西明等,2022,2024)。现在,中科闻歌坚持“一个产品”基座,围绕认知与决策智能平台DIOS,向具体场景落地应用进行微研发,又利用大模型的迁移学习能力在更多领域任务中实现泛化,让AI在更多的行业推广和融合(见图5)。近年来,中科闻歌的客户逐步从G端和大B端下沉,公司也能通过轻量级服务的方式,为中小企业提供服务。与此同时,雅意大模型的核心能力也在场景化应用中得到锻炼,进一步迭代升级,实现了大模型的场景化应用对自身与千行百业万企的双向赋能。
概言之,闻歌以基础研究、高质量领域数据、应用场景为核心,形成场景驱动技术升级、产品创新、价值绽放、客户拓展、应用拓展的企业创新生态飞轮,持续推动业务在更多场景中绽放出新的价值(见图6)。
2024年初,国家数据局等部门联合印发了《“数据要素×”三年行动计划(2024—2026年)》,旨在促进数据多场景应用以及多主体复用,培育基于数据要素的新产品和新服务,以实现数据要素乘数价值,为新质生产力提供新动能。
中科闻歌从2006年至今,抓住国家创新创业大潮,互联网和新媒体、大模型迅速发展的前沿趋势,把握“学术基因”“技术能力”“场景数据”三个关键,在技术研发、场景问题、用户需求的互动中不断迭代产品能力,适时调整业务模式,以飞轮旋转的方式在技术和市场两个方向上同时进步,跨越学术创业的“死亡之谷”(见图7)。企业级决策大模型的创新创业之路,激活了高质量领域数据的价值,在企业层面加速推进“数据要素×”行动,以AI大模型能力赋能百行千城万企。这一深耕场景的创业模式不仅使其成为认知与决策智能领域的先锋探索者,也为其他AI企业,尤其是学术创业企业提供有益参考。
未来展望
AI大模型为数字经济带来无限可能,其在吸引全球目光的同时,也引发各国政府及科技界对安全、伦理、道德等方面的担忧。全球面临AI产业赋能及安全监管的主要矛盾,受限自身算力基础设施不足、数字经济产业发展规模小等问题,多国独立发展AI大模型存在困难。站在AI技术从感知到认知再到决策演变的关键节点,加强企业与外界的互动,快速寻找新的场景并落地,同时出海拓展商业机会,让技术与市场保持螺旋式上升状态,必将成为AI企业发展和持续创新跃迁的主流趋势。中科闻歌目前已在国内15个核心城市部署了子公司,并积极开展海外布局,服务“一带一路”倡议。
展望未来,如何以闻海大数据平台、雅意大模型、DIOS数智平台这三大产品为核心,赋能感知、认知到决策的整个产品体系,实现面向场景的决策智能模型迭代,驱动决策智能和行动智能,实现从AIGC(Artificial Intelligence Generated Content)到AIGD(Artificial Intelligence Generated Decision)再到AIGA(Artificial Intelligence Generated Action)的跃迁,是中科闻歌能否在激烈的 AI产业竞争中持续成长的关键。唯有持续创新,才能稳步迈向全球领先的认知决策智能企业,成为服务新质生产力和人类发展的AI先导力量。
尹西明:北京理工大学管理学院副研究员,硕士生导师
朱益瑶:北京理工大学硕士研究生,通讯作者
苏雅欣:北京理工大学硕士研究生
李纪珍:英国best365官方网站入口教授,博士生导师。
责任编辑:高菁阳
来源:《清华管理评论》2024年5月刊