Fay是一个完整开源的数字人应用框架,向下对接语言模型,向上对接数字人。通过三个版本的Fay(带货版、助理版、agent版)及数字人模型的组合,可轻松实现:卖场导购、虚拟主播、数字人助理、虚拟服务员、虚拟教师、语音助手、文字助手、移动助手。
PaddleMIX是基于飞桨的多模态大模型开发套件,聚合图像、文本、视频等多种模态,覆盖多模态理解、多模态生成等丰富的多模态任务。它提供开箱即用的开发体验,同时支持灵活定制,高效完成各类多模态大模型任务,实现图像摘要、视频问答、动画制作能不同功能,助力探索通用人工智能。
PaddleVideo是飞桨官方出品的视频模型开发套件,旨在帮助开发者更好的进行视频领域的学术研究和产业实践。基于模块化的设计,提供丰富的视频算法实现、产业级的视频算法优化与应用,包括安防、体育、互联网、媒体等行业的动作定位与识别、行为分析、智能封面、视频标注、视频打标签等,涵盖动作识别与视频分类、动作定位、动作检测、多模态文本视频检索等技术。
Ascend Extension for PyTorch
MindSpore is a new open source deep learning training/inference framework that could be used for mobile, edge and cloud scenarios.
基于飞桨的OCR工具库,包含总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持多种文本检测、文本识别的训练算法。
一个发票OCR识别服务, 可识别铁路电子客票, 增值发票, 增值专用发票, 航空发票
基于spring boot + maven + opencv 实现的图像深度学习Demo项目,包含车牌识别、人脸识别、证件识别等功能,贯穿样本处理、模型训练、图像处理、对象检测、对象识别等技术点
EasyPR是一个中文的开源车牌识别系统,其目标是成为一个简单、高效、准确的车牌识别引擎。相比于其他的车牌识别系统,EasyPR有如下特点:* 它基于openCV这个开源库。这意味着你可以获取全部源代码,并且移植到java等平台。* 它能够识别中文。例如车牌为苏EUK722的图片,它可以准确地输出std:string类型的"苏EUK722"的结果。* 它的识别率较高。图片清晰情况下,车牌检测与字符识别可以达到80%以上的精度。