设为首页 简体 | 繁体 注册 | 登录

当前位置: 网站首页 > 科技 >

媒体融合进入智能化“快车道”

时间:2023-07-13 09:55来源:科技日报

  时而是龙卷风呼啸,时而是火星平原。

  “我感觉整个脚下好像都在动!”有人惊呼,但依然亦步亦趋跟随数字宇航员,一步步走向火星的最高火山——奥林匹斯山。

  发出惊呼的人,此时正在湖南长沙参观中国新媒体技术展。

  7月12日,2023中国新媒体大会在长沙开幕。作为大会重头戏,以“智慧促深融”为主题的中国新媒体技术展尤为热闹。“沉浸式航天元宇宙”体验区超现实场景的还原,更是吸引了诸多跃跃欲试的观众。

  我国媒体融合发展已走过10年。以AIGC(生成式人工智能)为代表的AI技术加速迭代演进,推动媒体融合进入智能化快速发展新时代。智媒技术不断助力媒体人,延伸“脚力”、提升“眼力”、增强“脑力”、创新“笔力”。

  中国新媒体技术展,向人们生动展出了我国媒体融合“十年磨一剑”的新生态。

  开展媒体融合生产应用基础研究

  让人流连忘返的“沉浸式航天元宇宙”,由新华社媒体融合生产技术与系统国家重点实验室打造。

  这一实验室是中宣部指导、科技部批准建设的媒体融合生产领域首个国家重点实验室,主要面向国家重大战略需求,聚焦人工智能在传媒、信息服务领域的应用,开展媒体融合生产应用基础研究。

  “沉浸式航天元宇宙”是利用空间信息技术、先进计算机图形技术等前沿技术打造的下一代互联网示范体验,其仿真度、延迟性等关键技术指标全球领先。“元宇宙”利用遥感数据构筑超仿真地外行星数字环境,可支持行星地表任务模拟、航天员训练。同时,它的核心技术实时渲染能支持低延迟交互,可为国家和社会的数字化转型提供“底座”。

  中央广播电视总台超高清视音频呈现国家重点实验室,则在展区搭建起了“三维菁彩声体验室”。工作人员告诉科技日报记者,三维菁彩声攻克了编解码传输、解码渲染、异构网络视音频同步传输三大关键技术,最终打破了声道限制,能满足不同场景下的音视频接收情况,为听众提供极致的沉浸式听觉体验。

  “解决了8K超高清电视及‘百城千屏’采用三维声或环绕声技术难题的同时,我们还在三维声制作、传输、终端渲染的整条链路上实现了自主创新的技术解决方案。”上述工作人员表示。

  新技术成就越来越多媒体虚拟人

  在中国新媒体技术展上,记者看到了越来越多的媒体虚拟人。

  科大讯飞展台展示了团队最新发布的讯飞星火认知大模型。基于新一代认知智能大模型强大的跨领域知识和语言理解能力,它学会了以自然对话方式理解与执行任务,从海量数据和大模型知识中持续进化,实现从提出、规划到解决问题的全流程闭环。

  星火认知大模型赋予虚拟人“超能力”。科大讯飞湖南公司总经理盛军介绍,团队自主研发的虚拟人智能交互机,运用了其最新AI虚拟形象技术,结合语音识别、语义理解、语音合成、虚拟形象驱动等AI核心技术,最终通过大屏交互一体机的终端形式落地,可实现用户与虚拟人物形象间“面对面”互动交流、业务咨询、智能问答、服务导览等多场景功能。

  华为展区,1∶1大小的AI数字人大模型姿态优雅。“基于云盘古基础大模型能力、渲染引擎和实时音视频能力,我们能构建数字人个性化大模型。模型生成后,用户通过文字、语音、视频等方式生产驱动向量信息,驱动数字人生成高清视频。”华为云现场工作人员肖淑玲说。

  新华智云展厅大屏幕数字古画卷,则展示了一种可古今“对话”的虚拟人。

  人们通过文化数字化操作系统互动屏,摄入人脸图像,便可自动生成个性化数字人偶形象,以及定制专属数字虚拟人。虚拟人可神奇地“一秒入画”,与画中古人对话交流。

  “结合大模型、AIGC、数字人等先进技术,可实现地方文化地标、历史名人大数据的深度挖掘,生成的内容有助于更快更广地传播中华优秀传统文化。目前,我们的技术已服务全国300多家文旅机构。”现场工作人员梁超说。

  腾讯云智能小样本数智人、北京聚力维度科技有限公司零门槛驱动超写实数字人、谦语智能AI数字人……或实现24小时不间断直播,或成为企业形象代言人。它们不断扩大应用场景,成为人们生活中触手可及的新“人力资源”。(记者 俞慧友 实习生 周文惠 王紫玥)

(责任编辑:永吉)
------分隔线----------------------------

人民在线新媒体| 人民在线杂志 | 联系我们 | 人才招聘 | 网站声明 | 法律顾问 | 人员查询

人民在线新媒体版权所有 未经授权不得转载 主办:人民在线杂志社

地址:北京市复兴门内大街45号4号楼(国务院国资委商业机关办公大楼) 香港湾仔骆克道315-321号骆基中心23楼

ICP备案号:京ICP备12036689号-1 京公安网备11010502022275