今日要点
1、腾讯云创建一站式行业大模型精选商店;
2、比Gen-2还好用的本文转视频扩散模型 VideoComposer;
(资料图)
3、又一款金融AI工具—公司债投资助手BondGPT;
4、清华大学提出LiVT,用视觉Transformer学习长尾数据,提高模型泛化能力;
5、微软给开发者的福音,在VS中整合“生成见解”工具,提升编译效率;
每日见智AI
1、直击腾讯云大模型技术峰会—解决大模型应用困难
腾讯云宣布推出MaaS(Model-as-a-Service)大模型服务,依靠腾讯云TI平台建造行业大模型精选商店,基于腾讯HCC高性能计算集群和大模型能力,为客户提供一站式大模型服务。
目前企业应用大模型所面临的困难主要包括:
计算资源少;大模式的训练和推理对于计算资源和存储资源有很高的要求,对于很多客户来说门槛比较高;数据质量差;数据是训练大模型的基础,质量不高就会导致模型的训练效果和效率难以保障;投入成本高;模型也需要持续的优化和调试以适配企业专项功能;安全合规;数据安全是企业调用模型最担心的问题;专业性人才短缺;
见智点评:
腾讯云从保护企业数据产权和隐私的角度,为客户提低成本、方便快捷的大模型服务,结合自身算力优势,从模型、数据、应用几个维度来打通企业应用大模型的困难。针对不同的应用场景,提供更适配的算力网络和智能应用助手,比如AI代码助手、会议助手等等。更重要的是,我们观察到MaaS服务可以满足客户模型的预训练、模型精调、智能开发等多样化需求,并且支持客户加入私域数据进行训练,极大的解决了企业对大模型数据安全的担忧。
对于如何解决企业应用大模型问题这个业内关注的焦点,华尔街见闻·见智研究非常荣幸邀请到澜码科技创始人&CEO【周健】来为大家带来最核心的解读:AI浪潮的下一个重要赛道,如何突破企业应用,找到核心的盈利秘籍? 欢迎大家预约直播:6月20日 周二 19:00。
2、比Gen-2还好用的本文转视频扩散模型 VideoComposer
文本生成视频的扩散模型VideoComposer ,能够在各种形式的合成视频中同时控制空间和时间模式,例如文本描述、草图序列、参考视频,甚至是简单的手工制作的动作。看起来比Gen-2的效果要强一些。
见智点评:
VideoComposer通过引入压缩视频中的运动矢量作为显式控制信号,结合时空条件编码器(STC-encoder),使用户能够以灵活的方式组合具有文本条件、空间条件和时间条件的视频。该方法能够有效地控制空间和时间模式,包括文本描述、草图序列、参考视频和手工制作的动作等。实验结果表明VideoComposer具有良好的性能和交互-帧一致性。
这项工作对于实现可控的视频合成在解决时间动态和跨帧时间一致性方面的挑战方面取得了显著进展,进一步推动了视觉内容创作的可定制化发展。
3、又一款金融AI工具—公司债投资助手BondGPT
美国金融科技公司Broadridge子公司LTX近期宣布,推出一款基于GPT-4大模型的聊天机器人APP BondGPT,应用于公司债投资。BondGPT主要面向公司债投资者,包括避险基金、交易商等等,可以回答各种与债券相关的问题,并帮助用户解决相关问题。
见智点评:
金融AI工具开发目前非常热门,在AI见闻周报中我们也分析过有很多金融机构已经开始进行AI项目研发,AI技术在金融行业的应用场景也非常丰富,比如AI交易员、金融舆情分析、辅助代码编写、研报知识库检索等都值得关注。
4、清华大学提出LiVT,用视觉Transformer学习长尾数据,提高模型泛化能力
清华大学在CVPR 2023的论文,Learning Imbalanced Data with Vision Transformers中详细探讨了如何有效利用长尾数据来提升视觉Transformer的性能,并探索解决现实世界中存在数据不平衡问题的新方法。
文章通过一系列实验发现,在有监督范式下,视觉Transformer在处理不平衡数据时会出现严重的性能衰退,而使用平衡分布的标注数据训练出的视觉Transformer呈现出明显的性能优势。相比于卷积网络,这一特点在视觉 Transformer 上体现的更为明显。另一方面,无监督的预训练方法无需标签分布,因此在相同的训练数据量下,视觉 Transformer 可以展现出类似的特征提取和重建能力。基于以上观察和发现,研究提出了一种新的学习不平衡数据的范式,旨在让视觉Transformer模型更好地适应长尾数据。通过这种范式的引入,研究团队希望能够充分利用长尾数据的信息,提高视觉Transformer模型在处理不平衡标注数据时的性能和泛化能力。
见智点评:
用视觉Transformer学习长尾数据方法不仅在实验中取得了显著的性能提升,而且无需额外的数据,具有实际应用的可行性。比如可以应用在医疗影像分析、安全监控等场景中。
数据往往存在不平衡性,即某些类别的样本数量远远少于其他类别。这导致传统的模型训练可能会偏向于预测数量较多的类别,而对于少数类别的性能衰退严重。通过用视觉Transformer学习长尾数据,可以更好地适应现实世界中的数据不平衡问题。同时还能够有效提升少数类别的识别性能,使模型能够更好地发现和理解样本特征以及提高泛化能力。
5、微软给开发者的福音,在VS中整合“生成见解”工具,提升编译效率
微软宣布,在 Visual Studio 2022 最新版本 17.7 中,将整合“生成见解”工具,以为开发者提升效率。微软公告表示“生成见解”已经在 VS 2022 中可用,该工具能为开发者提供深入的见解分析资料,使开发者更好地了解并且改善编译过程。
“生成见解”工具会在分析编译过程后出具一份报告,其中将会显示 “生成见解”分析每一段代码变量对于总编译时间的影响,可以让开发者直观的看出哪些特定代码存在问题,耗费大量的编译时间,能够提供开发者一些能够提升编译效率的方案。
可以让开发者更深入理解 C++ 开发,工具通过直观展示代码各部分在编译时的情况,可以让开发者更加了解 C++ 的深入运行过程,并通过了解各部分代码对于总编译时间的影响,找出最佳化编译流程的方法,在维持代码品质的同时,在一定程度上提升开发能力。
风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。