首个国产自研通用多模态大模型

新一代AI大脑
像人类一样能够自主感知环境、思考决策，做出行动

Awaker通过对多模态大模型的训练，使AI具备像人类一样对文字、图片和音视频的理解能力、推理能力、互动能力。技术上已经实现了图生文、文生图、视频生文、文生视频等多模态全方位的智能交互能力。

支持多模态多任务包括文本对话、图文对话、视觉生成、复杂推理、视觉检测、文本检测、OCR等
更懂中文集文本、图像、视频、音频等多模态信息联合训练,更加适应中文的语言环境

立即体验

Awaker通用多模态大模型
是视觉理解与生成的超级融合

多媒体内容搜索视频素材搜索与管理
视频搜索剪辑生成按需搜索照片视频、素材一键成片、文生视频
智慧巡检光伏、电力、城管、水务、安防
机器人感知决策机器人人机交互，语音、识别、分析

市场营销按需生成市场营销物料
应用产品ToC的消费级应用产品
影视动画文本—图像，提供影视动画素材
数字孪生快捷生成城市数字孪生模型

具身智能通过感知和交互与环境进行实时互动
教育教学个性化智能辅助教育，促进学生更好地成长
医疗健康助推中医药建设，赋能中医药传承创新发展
文化传媒驱动数字文化产业高质量发展

Awaker-VL主打看懂世界

对话大模型
图生文
图文会话

01信息解读

请详细描述这张照片

这张照片是一副名为“星夜”的画作，作者是荷兰画家梵高，画面中我们可以看到繁星点点的星空，星星仿佛在跳跃，而地面上则是个小镇和一些树木，画面中央还有一栋高塔。整幅画笔...

02逻辑推理

图形中会带来的结果

如果任由火势燃烧，可能会引发周边的可燃物着火，造成更大的火灾。同时，燃烧产生的烟尘和有害气体会对环境造成污染，对人的健康也会造成危害。因此，应该尽快扑灭火灾，避免造成更大的损失。

03内容创作

作一首诗

城市上空彩虹出，霓虹闪烁夜色繁, 人潮涌动忙碌里，自然鬼斧神工显，点缀都市瑰丽画，令人心中生欢喜。

04情感能力

他现在情绪如何

他看起来有点沮丧或失落，因为他坐在沙发上，把手放在脸上，可能在思考或担心着什么事情。

05总结概括

她在做什么

这段视频中，女人坐在汽车里，看起来她在使用手机。

06空间想象

如果给这个图布置灯光，怎么设置合适?

从图片来看，客厅的主色调是白色，建议使用柔和的黄色光线来增加温馨感，适当的摆放一些落地灯来营造环境氛围。另外，窗帘也可以起到柔化灯光的作用，选择具有穿透性的窗帘能够增加室内的来光度。地毯可以选择颜色深浅适中的，搭配上深色的装饰品，让这个空间更加协调统一。

07判断预测

图中场景会不会有危险

无法判断该场景是否存在危险，因为没有描述具体情境或危险因素。但是，由于囚犯们争斗，所以这个场景可能是比较混乱和不安全的。

08检测报警

图中管道是否需要报警维修?

是的，图中管道有一段不完整，需要报警维修。

01/08信息解读