在过去的18个月内,人工智能爆发式的发展备受瞩目,从随处可见的基于卷积神经网络的“人脸与物体识别”,到“自动驾驶”的成功商业化,亦或是基于Transformer架构的“大语言模型”,以及基于Diffusion的“自动图像生成”等,均在科技界、企业界和社会中激起了广泛讨论。越来越多的企业认识到,随着技术的飞速发展,采用人工智能(AI)来辅助实现改善业务流程、提高工作效率、加强竞争生存能力、推动创造全新价值将是企业持续发展的必由之路。但是AI仅仅只能依存在现有的移动设备和PC电脑上吗?有没有更好的载体能使其充分发挥潜力呢?
中数元宇数字科技(上海)有限公司(以下简称ChiMETA)是由一群对AI及其应用感兴趣的爱好者们共同创建的,他们有了完美的答案。
他们认为,人工智能是未来工作和生产发展的助推剂,工作和生产的工具迭代也不会停下脚步,未来的生产工作模式将从二维平面向三维空间进化,XR设备将是主要趋势之一。而其中的MR混合现实智能眼镜有着虚拟元素与物理空间完美结合的独特优势,如果在形态、外观、交互方式和开放性上进行革新,变得符合工作和生产的基本特性,那将大大释放AI改变工作和生产的潜力,并且创造出更多的AI应用场景和用途。
【资料图】
ChiMETA第一代产品是一款超轻的MR眼镜(见图1),重量仅150克。它配备高分辨率的双目相机,可以在实现接近光学透视效果的同时完成计算机视觉任务。该产品的计算单元与眼镜分离,通过有线连接提供最大的便携性和稳定性。基于产品定义,研发团队开发了世界上第一款空间内精准触控的虚拟键盘,允许使用者与三维空间内的应用系统更方便的交互,而无需任何配件。
ChiMETA基于自研AI算法实现的虚拟键盘,具有高准确率和低误触率的优势,且实现了厘米级的高精度指尖定位交互。团队依此还开发了三维空间内的虚拟触控方法和习惯手势自定义的应用(见图2)。这意味着用户可以与MR眼镜中看到的环境内的一切
物体(如虚拟键盘、云桌面电脑、文档纸或甚至喝一杯茶)进行完全裸手的交互,摆脱了电子指环、电子手套和实体手柄等辅助设备的限制。
ChiMETA是第一个在2022年初就验证了立体彩色透视技术的公司。区别于其他VR眼镜,ChiMETA的MR眼镜上将永久开启立体彩色透视功能。这意味着在需要移动过程中与实物交互的业务场景中,用户也能安全使用。区别于其他AR眼镜相对较小的视场角范围和向阳不可见的现状,ChiMETA的MR眼镜中提供了多个自由摆放的虚拟显示屏幕(见图3),既可以巨幕显示,也能环幕摆放,这意味着用户在生产工作中,全视野范围内都可以是交互和操作的空间,并且不受环境亮度影响。
ChiMETA现在专注于最先进的AI算法及应用(见图4)。研发团队为提高工作体验和改善生产力,正在开发一个针对企业客户私有化定制的大语言模型训练框架。在MR眼镜内安装生物识别传感器或者安全芯片后,ChiMETA的GPT模型可以安全地访问企业的私有信息,并协助用户完成给定的重复或创造性任务。在MR眼镜内,研发团队设计和开发了实时解决不同场景下的经典计算机视觉任务,包括多目标识别、追踪和计数、高精度深度估计、同时定位和地图构建(SLAM)、已识别对象的三维重建,以实现远程协作等。
请大家试想一下,今后带上ChiMETA的MR眼镜:企业员工可以访问公司内部知识图谱,利用自然语言提供实时决策支持;医生可以在视野中叠加诸如患者的CT扫描结果或实时生命体征数据和病历信息等数字资料,查看病情进展或者辅助诊断,并和患者共享信息;在制造业中,当工人戴上MR眼镜,利用AI识别产品及配件后,就可以实时获取产品组装的步骤和远程的指导,极大地降低错误率、提高生产效率;在教育领域,学生可以通过MR眼镜与虚拟对象进行互动,加深对知识的理解和记忆。此外,MR眼镜还有助于建筑设计、物流管理、零售体验等领域的创新和改进。
尽管目前MR眼镜尚未完全普及,但它作为人工智能的新载体,必将在未来企业中发挥更重要的作用。结合5G、人工智能和可穿戴设备等新技术的发展,MR眼镜将辅助各行业实现自动化生产和实时协作,成为企业运用AI驱动业务的重要工具。企业也可以通过MR眼镜构建功能更加完善和深度定制的人工智能系统,以支持各类复杂任务的高效执行。人工智能的应用也将因此得到以深化和拓展。
MR眼镜正在成为人工智能发展道路上又一件不可或缺的装备。它给企业带来了前所未有的机遇,同时也带来挑战,这需要企业具备数字化转型的视野与勇气。面向未来,MR眼镜与人工智能的深度融合,必将重塑企业的运营模式,推动产业变革升级。