13万人涌入CES!生成式AI“地毯式”落地!
最近,CES2024在美国拉斯维加斯举行了为期四天的科技盛宴,吸引了全球4000多家参展商和约13万参观者。其中,三成企业为中国公司。作为科技行业最重要的展会之一,CES吸引了来自全球各地的科技公司,他们在这里交流并展示新发明。人工智能、数字健康、智能家居和可持续性技术等领域备受瞩目。
01 人工智能成为焦点
这次展会可谓是近年来最为激动人心的一届,各种前沿科技产品琳琅满目。随着ChatGPT、Bard等程序、语音助手的出现,以及智能家电的普及,人工智能技术正逐渐渗透到日常生活中。根据官方数据统计,27%的美国人认为AI技术已经对他们的日常生活产生了重大影响。
▲CES现场图
根据现场堂友们观察,今年的CES在生成式AI、VR/AR/XR、人形机器人、AI芯片、AI PC、无线/透明电视、智能家居、科技新物种等多个领域受到广泛关注,其中生成式AI展区尤为亮眼。
02 生成式AI新硬件席卷全领域
在CES上,美国人工智能个性化操作系统开发商Rabbit发布了一款备受瞩目的独立AI硬件设备R1。该产品基于大型动作模型(LAM)设计,是一款通用应用程序控制器。用户只需告诉R1自己的需求,无需打开各种应用程序,就能完成音乐播放、打车、购物、发信息等操作。
▲用R1查询旅行建议(图源:Rabbit) 现今,从上车入户到衣食住行等各个领域,传统电子设备都在纷纷接入生成式AI。例如,三星的8K QLED系列电视具备AI图像升级功能,来自美国的初创公司Telly的语音助手能够个性化任务,联想旗下Think、Yoga等系列新品开始配备生成式AI软件,法国智慧健康科技公司展出了全球首款基于生成式AI的智能镜子BMind,华米旗下Oclean推出了一款能够与之交谈的智能数字牙刷等。 ▲CES现场(图源:智东西、OSMOND CHIA) 03 构建生成式AI的首要挑战
在构建特定行业场景的生成式AI应用时,我们需要将通用大模型与行业数据、场景数据以及业务需求相结合。亚马逊云科技的首席数据官在2024年的洞察中指出,企业在实现生成式AI潜力方面面临的首要挑战是数据。
▲2024年AWS首席数据官洞察报告
当然,还有其他因素,比如寻找合适的用例、围绕有效和负责任的使用生成式AI设定护栏、安全和隐私、以及开发、修改或应用LLM所需的技能等方面也面临着重要的挑战。
04 数据是构建生成式AI的重要因素
在当前的市场环境中,越来越多的企业和开发者希望能够迅速部署大模型,并将其应用于多样化的场景。为实现这一目标,数据堂为企业提供了有效的生成式AI解决方案。
▲生成式AI数据解决方案
基础数据 数据堂拥有大规模无标注文本数据、自然语言处理数据、多语种平行语料数据,以及多场景的图文描述数据,可用于图像描述和文本生成图像任务。这些数据覆盖的场景和量级正在持续扩充。同时,数据堂还提供单一模态和跨模态的数据获取与清洗服务,来自全球客户的选择,数据质量更有保障。 多模态数据标注 图文AIGC技术需要大规模的图像描述数据集进行训练,而图像信息生成器需要去噪数据集,为保证凸显图像合成效果,通常也需要部分美学图像描述数据集作为辅助。数据堂可以轻松应对多模态数据标注任务。 监督微调数据标注 通过对prompt标注、output标注等工序,数据堂可以帮助客户生成高质量的监督微调数据,用于模型微调,数据需要符合具体性、相关性、真实性、连贯性、无害性等规范。 RLHF人工标注 数据堂可以针对SFT训练后的模型生成的多个结果按照客户给定的规则进行人工排名、 多因素打分。通过培训标注员对齐价值观,以及多人拟合的方式提升反馈的质量,以此提升大模型输出结果的质量,使之更加贴近人类价值观,并有益。 红队测试 数据堂的专业人员可以对模型发起各种对抗攻击,如试探性的或者危险性的问题,以发现潜在问题并予以解决。通过红队测试,帮助客户发现其模型在不准确信息(幻觉)、有害内容、虚假信息、歧视、语言偏见、涉及传统和非传统武器扩散的信息等方面的问题。 大模型评测 数据堂可帮助客户从回答能力、价值对齐等多个维度进行评测,考察大模型在单轮和多轮问答两个方面的回答能力,以及大模型是否安全、可靠、实用,尽可能防止模型的有害输出或滥用行为。这有助于客户快速且有针对性地提升大模型的性能。 05 结语
生成式AI正在改变人机交互的方式,帮助每个人适应人工智能时代的到来。生成式AI所带来的创新和价值让我们深刻感受到技术对生活的变革。让我们积极拥抱生成式AI的未来,让数据成为开启生成式AI安全探索之旅的关键。