预训练大模型产业落地的爆发前夜,联汇科技已提前部署

一家新的AI公司正在开发大规模的预训练模型。2021年将是大规模预训练模型爆发的一年,将掀起新一轮人工智能浪潮,并迅速成为人工智能领域技术的新高地,推动人工智能从1.0感知智能向2.0认知智能转变。自2012年深度学习应用元年以来,人脸识别、语音识别等技术通过机器学习实现了大规模应用场景的突破,不仅提高了社会工作效率,同时改变了人们的生活出行模式,确立了人类对人工智能技术的基础认知。但是,经过多年的应用实践,传统的人工智能在特定场景、特定内容、特定需求的适应模式上也暴露了许多短板,特别是在通用场景应用、小样本及复杂场景中,只能达到“有多少人工,有多少智能”的基础感知,识别精度差,泛化能力低。为了实现人工智能的真正落地,必须使机器具有通识知识的自我学习能力,以及对业务的逻辑判断能力,构筑机器综合认知系统。预训练技术允许深度神经网络模型在大规模未标记数据上进行自监督学习,从而允许构建超大规模模型。自谷歌于2018年发布BERT以来,OpenAI、谷歌、Facebook、微软、NVIDIA、智源研究院、阿里达尔马研究院、华为、百度等研发机构和企业都进行了大规模的预训练模型布局,引发了人工智能参数和计算能力的军备竞赛。虽然目前竞争的参数呈指数级增长,但每一项技术应用都有其重点。因此,2021年8月,基于大模型的特性和未来发展前景,斯坦福大学的PerLiang、李飞飞等100多位学者联合发表了200多页重研究综述《 On the unities and Rof Foundation Models 》,在以大事前模型命名为模型的Foundation Models新一轮大规模预训练模型商业化热潮中,最近,在深投控牵头投资、Sunac Investment等共同参与的联合科技D轮融资下,一家从事这一大规模预训练模式研发的新型人工智能公司应运而生。与大量的AI新不同,联想科技在十几年的以及音像图表分析方面具有丰富的应用经验,就像一只等风来的候鸟一样,建立了一个针对视觉的多模态事前大模型,努力改变了视觉分析和多模态分析领域的人工智能实现方式。从语言模型到视觉语言模型

连汇科技首席科学家赵天成博士是世界级人工智能青年科学家,毕业于全球计算机领域的顶尖学校--卡内基梅隆大学,获得计算机博士学位,是多模机器学习和自然语言处理领域的国际青年创新人才,是端到端人机交互理论的创始人,也是谷歌、微软、谷歌、微软、谷歌等公司的创始人。它得到了亚马逊等顶级同行专家的高度评价。他曾多次担任国际顶级会议和期刊的审稿人和区域主席,在国际顶级会议和期刊上发表论文30余篇,多次荣获最佳论文奖,并于2018年荣获微软研究院最佳和最聪明博士学位。赵天成博士一直专注于提高机器认知能力的研究,使机器能够理解更多模式的数据类型,并自主学习和理解更复杂的知识,就像人类大脑一样,用更少的数据样本。基于卡内基梅隆大学多年的研究,赵天腾博士带领团队创建了OmModel,这是一种拥有专有知识产权的大型预训练视觉语言模型。与国内大部分研发机构和企业专注于相对成熟的大规模语言模式不同,联合科技更注重于前沿的视觉语言大规模模式课程。所谓视觉语言模型,是指通过1个事前训练模型同时理解自然语言和视觉信息,可以构筑它们的关系。因此,与只能解决NLP问题的语言模型相比,视觉语言模型的应用面更广,可以解决更复杂的实际问题,通过连接视觉和语言这两个重要的模态信息,使人工智能具有真正的认知能力。目前,联通科技的OmModel已经完成了基于数十亿以上字符、近数十亿图像和视频数据的大规模预训练,同时在包括目标检测、行为识别、跨模态检索等在内的许多关键任务中显示出超强的零样本泛化能力和小样本学习能力。2.建立一个大规模的工业模型

此外,转回,做核心化落地也是联营科技的一大特色。“我们的目标是建立行业大模型体系,让预训练大模型真正实现产业化落地,成为客户有价值的产品,而不是单纯地追求模型参数量。赵天成博士说。联想科技基于OmModel Om Studio在用户没有训练数据或训练数据少的前提下,利用大模型的超一般能力,在数小时内完成AI视觉算法匹配,实现AI业务应用零门槛,服务千行百业视觉场景应用。对于少数特定的需求任务,OmModel只需微调更少样本的标签附加数据,就可以实现应用程序匹配。改变传统人工智能需要大量高级工程师和大量标记数据的困境,大大降低了构建人工智能应用的门槛,同时提高了响应效率,实现了人工智能2.0向大量长尾通用需求的扩展。OmOS是一个大模型执行和操作系统,用户可以结合语义进行基础逻辑判断,实现业务知识与AI模型的有效结合,真正解决需求方痛点。例如,对于车站等复杂的场景,对戴口罩的场景的识别判断不仅能够判断是否戴口罩,还能够判断是否戴口罩,排除孩子没有戴口罩。可以判断在饮用食品时排除没有戴口罩等行为,这些都不需要依赖于样本数据,只需通过单纯的语义定义即可。通过这一系列创新技术应用,使OmModel视觉语言的大规模预训练模型在自主学习能力、响应能力和认知识别能力方面有了质的提高.目前,联欢科技的Om OS和Om Studio两款产品已经实现了基于多模式数据文件的数字资产管理、知识图分析等应用,以及基于监控摄像头信号的美丽乡村、智慧城市管理、数字防疫、智能商店、明厨亮炉等数十个场景的应用落地。并在国内率先开启人工智能从感知智能向认知智能转变的2.0迭代升级,打破传统人工智能对样本数据的依赖,实现了传统算法厂商无法应对的80%长尾应用场景仅用10%的标记数据快速解决。大大降低了人工智能落地应用门槛,有利于快速、低成本地推广视觉认知技术在各个行业的应用。100家银行为数千个行业的数字化改革提供技术力量。联想科技,通过大事前模型在人工智能应用上的实践,使人工智能可以从知觉智能向智能转换,大事前模型必然带来人工智能的二次。碰撞就是融合,历史的车轮总是在碰撞中前进,人工智能技术的车轮也是如此,人类想象未来的步伐从未停歇。

返回列表
上一篇:
下一篇:

文章评论