华为昇腾面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解。
基于Java开发的全能视觉智能识别项目 纯java 调用 yolo onnx 模型 AI 视频 识别 支持 yolov5 yolov8 yolov7 yolov9 yolov10,包含 预处理 和 后处理 。java 目标检测 目标识别,可集成 rtsp rtmp,车牌识别,人脸识别,跌倒识别,打架识别,车牌识别,人脸识别 等
Fay是一个完整开源的数字人应用框架,向下对接语言模型,向上对接数字人。通过三个版本的Fay(带货版、助理版、agent版)及数字人模型的组合,可轻松实现:卖场导购、虚拟主播、数字人助理、虚拟服务员、虚拟教师、语音助手、文字助手、移动助手。
一个发票OCR识别服务, 可识别铁路电子客票, 增值发票, 增值专用发票, 航空发票
PaddleMIX是基于飞桨的多模态大模型开发套件,聚合图像、文本、视频等多种模态,覆盖多模态理解、多模态生成等丰富的多模态任务。它提供开箱即用的开发体验,同时支持灵活定制,高效完成各类多模态大模型任务,实现图像摘要、视频问答、动画制作能不同功能,助力探索通用人工智能。
🚀 基于大语言模型和 RAG 的知识库问答系统。开箱即用、模型中立、灵活编排,支持快速嵌入到第三方业务系统。
YOLOSHOW - YOLOv11 / YOLOv10 / YOLOv9 / YOLOv8 / YOLOv7 / YOLOv5 / RTDETR / SAM / MobileSAM / FastSAM YOLO GUI 基于 Pyside6 的图形化界面
PaddleVideo是飞桨官方出品的视频模型开发套件,旨在帮助开发者更好的进行视频领域的学术研究和产业实践。基于模块化的设计,提供丰富的视频算法实现、产业级的视频算法优化与应用,包括安防、体育、互联网、媒体等行业的动作定位与识别、行为分析、智能封面、视频标注、视频打标签等,涵盖动作识别与视频分类、动作定位、动作检测、多模态文本视频检索等技术。
MindSpore is a new open source deep learning training/inference framework that could be used for mobile, edge and cloud scenarios.