13万人涌入CES！生成式AI“地毯式”落地！

发布日期：2024-01-19 来源：数据堂分享到：

最近，CES2024在美国拉斯维加斯举行了为期四天的科技盛宴，吸引了全球4000多家参展商和约13万参观者。其中，三成企业为中国公司。作为科技行业最重要的展会之一，CES吸引了来自全球各地的科技公司，他们在这里交流并展示新发明。人工智能、数字健康、智能家居和可持续性技术等领域备受瞩目。

01 人工智能成为焦点

这次展会可谓是近年来最为激动人心的一届，各种前沿科技产品琳琅满目。随着ChatGPT、Bard等程序、语音助手的出现，以及智能家电的普及，人工智能技术正逐渐渗透到日常生活中。根据官方数据统计，27%的美国人认为AI技术已经对他们的日常生活产生了重大影响。

▲CES现场图

根据现场堂友们观察，今年的CES在生成式AI、VR/AR/XR、人形机器人、AI芯片、AI PC、无线/透明电视、智能家居、科技新物种等多个领域受到广泛关注，其中生成式AI展区尤为亮眼。

02 生成式AI新硬件席卷全领域

在CES上，美国人工智能个性化操作系统开发商Rabbit发布了一款备受瞩目的独立AI硬件设备R1。该产品基于大型动作模型（LAM）设计，是一款通用应用程序控制器。用户只需告诉R1自己的需求，无需打开各种应用程序，就能完成音乐播放、打车、购物、发信息等操作。

▲用R1查询旅行建议（图源：Rabbit）

现今，从上车入户到衣食住行等各个领域，传统电子设备都在纷纷接入生成式AI。例如，三星的8K QLED系列电视具备AI图像升级功能，来自美国的初创公司Telly的语音助手能够个性化任务，联想旗下Think、Yoga等系列新品开始配备生成式AI软件，法国智慧健康科技公司展出了全球首款基于生成式AI的智能镜子BMind，华米旗下Oclean推出了一款能够与之交谈的智能数字牙刷等。

▲CES现场（图源：智东西、OSMOND CHIA）

03 构建生成式AI的首要挑战

在构建特定行业场景的生成式AI应用时，我们需要将通用大模型与行业数据、场景数据以及业务需求相结合。亚马逊云科技的首席数据官在2024年的洞察中指出，企业在实现生成式AI潜力方面面临的首要挑战是数据。

▲2024年AWS首席数据官洞察报告

当然，还有其他因素，比如寻找合适的用例、围绕有效和负责任的使用生成式AI设定护栏、安全和隐私、以及开发、修改或应用LLM所需的技能等方面也面临着重要的挑战。

04 数据是构建生成式AI的重要因素

在当前的市场环境中，越来越多的企业和开发者希望能够迅速部署大模型，并将其应用于多样化的场景。为实现这一目标，数据堂为企业提供了有效的生成式AI解决方案。

▲生成式AI数据解决方案

基础数据

数据堂拥有大规模无标注文本数据、自然语言处理数据、多语种平行语料数据，以及多场景的图文描述数据，可用于图像描述和文本生成图像任务。这些数据覆盖的场景和量级正在持续扩充。同时，数据堂还提供单一模态和跨模态的数据获取与清洗服务，来自全球客户的选择，数据质量更有保障。

多模态数据标注

图文AIGC技术需要大规模的图像描述数据集进行训练，而图像信息生成器需要去噪数据集，为保证凸显图像合成效果，通常也需要部分美学图像描述数据集作为辅助。数据堂可以轻松应对多模态数据标注任务。

监督微调数据标注

通过对prompt标注、output标注等工序，数据堂可以帮助客户生成高质量的监督微调数据，用于模型微调，数据需要符合具体性、相关性、真实性、连贯性、无害性等规范。

RLHF人工标注

数据堂可以针对SFT训练后的模型生成的多个结果按照客户给定的规则进行人工排名、多因素打分。通过培训标注员对齐价值观，以及多人拟合的方式提升反馈的质量，以此提升大模型输出结果的质量，使之更加贴近人类价值观，并有益。

红队测试

数据堂的专业人员可以对模型发起各种对抗攻击，如试探性的或者危险性的问题，以发现潜在问题并予以解决。通过红队测试，帮助客户发现其模型在不准确信息（幻觉）、有害内容、虚假信息、歧视、语言偏见、涉及传统和非传统武器扩散的信息等方面的问题。

大模型评测

数据堂可帮助客户从回答能力、价值对齐等多个维度进行评测，考察大模型在单轮和多轮问答两个方面的回答能力，以及大模型是否安全、可靠、实用，尽可能防止模型的有害输出或滥用行为。这有助于客户快速且有针对性地提升大模型的性能。

05 结语

生成式AI正在改变人机交互的方式，帮助每个人适应人工智能时代的到来。生成式AI所带来的创新和价值让我们深刻感受到技术对生活的变革。让我们积极拥抱生成式AI的未来，让数据成为开启生成式AI安全探索之旅的关键。

13万人涌入CES！生成式AI“地毯式”落地！

你知道你的Internet Explorer是过时了吗?