智能语音
基于语音识别、语音合成等技术,为企业在多种实际应用场景下,赋予产品‘能听、会说、懂你’式的智能人机交互体验
![]() | ![]() | |
语音识别 | 语音合成 | 语音分析 |
国内独创的字级LC-BLSTM/DFSMN-C | 合成音真实饱满、抑扬顿挫、富有表现 | 构建语音交互场景下的口语理解和 |
视觉图像
构建以图像视频为媒介的产品和应用,提升商业效率或创造商业新机会,广泛应用于新零售、新媒体、新制造等领域
![]() | ![]() | ![]() | ![]() |
文字识别 | 图片识别 | 人脸识别 | 视频能力 |
将图片、照片上的文字内容 | 可精准识别图像中的视觉 | 提供人脸检测定位、人脸属性 | 通过对视频的多维理解,视频进行智能分析、主体识别、封面生成、内容检索等高效的服务 |
语言技术
致力于实现人与机器之间用自然语言进行有效沟通的各种理论和方法,在客服、资讯、司法、医疗等场景有广泛的应用
![]() | ![]() | ![]() | ![]() |
文本审核 | 词法分析 | 文本纠错 | 情感分析 |
自动识别出文本中夹杂的违 | 依存句法通过分析句子中 | 准确识别输入文本中出现的拼 | 对带有情感色彩的主观性文本 |
场景方案
![]() | ![]() | ![]() | ![]() |
智能客服 | 信息审核 | 智能会议 | 智慧法庭 |
基于阿里云AI平台,实现智能营销、智能外 呼、在线客服等多种应用场景,帮助企业节 省人力成本投入、提高服务质量、实现企业 智能化营销等。 | OCR卡证识别通过对身份证、营业执 照、不动产权证等多种卡证的结构化 提取,有效解决各行业对客户身份信息 的快速采集、录入、管理的需求,实现快 速审核,有效提升用户体验。 | 可帮助用户实现智能会议的全流 程,包括会议创建、以及通过实时 语音自动转写、分角色辅助记录会 议内容、会议记录自动存储等,支 持线上公共云以及本地化部署。 | 智能庭审记录解决方案利用先进 的语音识别技术代替传统人工 输入,客观完整地还原庭审过程及 原貌,提高庭审记录效率,有效缓解 案多人少的矛盾。 |
![]() | ![]() | ![]() | ![]() |
智慧课堂 | 智慧医疗 | 图片搜索 | 智慧媒体 |
围绕互动课堂,通过语音、视觉等能力 识别课堂上动作、对话,监测教学质 量。更多应用场景体现于AI考勤、举手 识别、口语评测、课件生成等 | 借助AI中的信息抽取、知识图 谱、智能对话等语音、语义技术,帮助 用户个性化定制导诊场景,避免患者 盲目就医,有效减轻工作台压力,明显 提升患者就医体验。 | 通过人工智能视觉技术,实现拍 照购物、商品推荐、布料搜索、图 片版权保护、商标查询等场景,从 而简化搜索流程,提升用户体 验、提高企业效率。 | 以AI平台为基础,基于平台能力及业务 数据积累,更灵活、更全面、更实时的 满足采编播存各个环节的运营诉 求,提高内容制作效率,释放人力。 |