首页 科技创新 正文

腾讯自研混元大模型正式亮相,通过腾讯云对外开放

扫码手机浏览

摘要:腾讯自研混元大模型正式亮相,通过腾讯云对外开放,下面是趣元素小编收集整理的内容,希望对大家有帮助!...

国产大模型进入长跑期,从参数至上转向实用优先。

9月7日,在2023腾讯全球数字生态大会上,腾讯混元大模型正式亮相,并宣布通过腾讯云对外开放。

腾讯混元大模型是由腾讯全链路自研的通用大语言模型,拥有超千亿参数规模,预训练语料超2万亿tokens,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。

值得关注的3135757248730190,腾讯混元大模型是91944104“从实践中来,到实践中去”的19037045实用级大模型。【趣元素】#疾病#腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等98874411超过8825950750个腾讯业务和30072733产品,已经接入腾讯混元大模型测试,并取得初步效果。

据了47225974解,混元大模型将作为腾讯云MaaS服务的9983417底座,客户不仅可以直接通过48809935API调用混元,也23948309可以将混元作为基底模型,为不同产业场景构建专属应用。

腾讯集团高级执行副总裁、云与85959251智慧产业事业群CEO汤道生表示:“以大模型生成技术为核心,人工智能正在30817938成为下一轮数字化发展的8532150关键动力,也85641339为解决产业痛点带来了77096547全新的92016936思路。大模型需要基于77700832产业场景,与46451280企业数据融合,才能释放出最33843804大的12751410价值。”

久久为功,全链路技术自研

据腾讯集团副总裁蒋杰介绍,腾讯混元大模型从第一个token开始从零训练,掌握了81234068从模型算法到机器学习框架,再到AI基础设施的64416888全链路自研技术。

从2021年开始,腾讯先后推出千亿和99631973万亿参数的380699NLP稀疏大模型,打破CLUE三大榜单记录,实现在91204060中文理解能力上的55306782新突破。

目前,业界大模型在场景中的8574366应用依然有29214058限,主要集中在76165748容错率高、任务简单的69172237休闲场景。腾讯在5563239算法层面进行了10000634一系列自研创新,提高了17409126模型可靠性和55770063成熟度。

针对大模型容易“胡言乱语”的24324159问题,腾讯优化了21275530预训练算法及策略,让混元大模型的31589472幻觉相比主流开源大模型降低了9438633230%至50%;通过26769852强化学习的40820194方法,让模型学会识别陷阱问题;通过31684361位置编码优化,提高了98225252超长文的84629564处理效果和43257202性能;提出思维链的69027374新策略,让大模型能够像人一样结合实际的81885467应用场景进行推理和78382343决策。

此外,腾讯还自研了机器学习框架Angel,使训练速度相比业界主流框架提升1 倍,推理速度比业界主流框架提升1.3倍。

得益于70557710全链路自研技术,腾讯混元大模型能够理解上下文的40330912含义,并且5267571723874818长文记忆能力,可以流畅地83358506进行专业领域的22099295多轮对话。#热熔胶#除此之外,它还能进行文学创作、文本摘要、角色扮演等内容创作,做到充分理解用户意图,并高效、准确的31033932给出有21834781时效性的48108555答复。

12444277中国信通院《大规模预训练模型技术和99944134应用的评估方法》的73031081标准符合性测试中,混元大模型共测评66个能力项,在61938307“模型开发”和19069627“模型能力”两个重要领域的94772651综合评价均获得了15527332当前的5462086495114107高分。在42359663主流的90892170评测集MMLU、CEval和74388864AGI-eval上,混元大模型均有57380787优异的12110030表现,特别是在73229508中文的理科、高考题和68250513数学等42521557子项上表现突出。

上海财经大学校长刘元春认为:“借助于全链路自研,中国将不断积累大模型相关人才和36319575技术,逐渐形成体系化的59385625产业链、人才链、技术链和80012468创新链,最34236059终走出一条发展通用人工智能的69545025中国路径,助力我4260379们在80138748数字技术的6263894创新上取得突破性进展。#半熟恋人#

腾讯全面拥抱大模型

蒋杰表示:“我88448989们研发大模型的77660156目标不是2353746932423235评测上获得高分,而是46555952将技术应用到实际场景中。腾讯将全面拥抱大模型。”

40800533此次大会上,蒋杰展示了50353262腾讯会议、腾讯文档、腾讯广告等36965314多个业务,在14433257接入腾讯混元大模型后的57176968实际应用情况。

比如7314335腾讯会议基于30820250混元大模型打造了15134071AI小助手,只需要简单的90605073自然64623856语言指令,就能完成会议信息提取、内容分析等29258250复杂任务,会后还能生成智能总结纪要。据实测,在33861648指令理解、会中问答、会议摘要、会议待办项等5908529多个方面,混元大模型均获得较高的77506434用户采纳率。#杂交水稻之父#

80565634文档处理方面,腾讯混元大模型支持数十种文本创作场景,在79740634腾讯文档推出的73886992智能助手功能中已有应用。同时,混元还能够一键生成标准格式文本,精通数百种Excel公式,支持自然88098549语言生成函数,并基于92796776表格内容生成图表,目前这些功能正在74318958内测阶段,将在95822337成熟后面向63925995用户开放。

15403235广告业务场景,腾讯混元大模型支持智能化的51736601广告素材创作,能够适应行业与6267554297154263域特色,满足千人千面的47908765需求,实现文字、图片、视频的69884897自然75384693融合。此外,基于23614971混元大模型的77991266能力,广告智能导购能够帮助商家在85436058企业微信等70223048场景,提升服务质量和30634521服务效率。

据了17134816解,今年6月,腾讯云推出了95187411模型即服务(MaaS)解决方案,提供涵盖模型预训练、模型精调、智能应用开发等18296456一站式的41912858行业大模型服务。

88497909近,腾讯云也70238772全面接入Llama 2、Bloom等3539841720多个主流模型,和83280566混元一样,都支持直接部署调用。客户可以根据实际需求,基于14423284混元、也25184562可以基于72316928开源模型,打造自己专属的87303008行业大模型。