首页
Python
Java
IOS
Andorid
NodeJS
JavaScript
HTML5
低功耗AI视觉感知技术及设备研制
2024-10-02
面向视频的全新AI架构 —— 阿里云智能视觉技术全解
我们都知道,AI技术正在以可见的速度被应用于各行各业,然而绝大部分业务场景想应用AI技术,都需要算法工程师根据自身业务的标注数据,来进行单独训练,才能打磨出合适的AI模型.如此一来,如何以最低的门槛和成本,实现AI技术落地变成了行业急需解决的问题. 市场上的AI服务非常多,但是在视觉领域,通用的AI服务主要是基于图像的架构来做的,视频时代已经到来,基于图像的AI架构是否还能被广泛应用?阿里云视频云团队专注于视频领域,所以在针对视频的AI处理方面也有独特的思考和实践.3月27日下午,第51期阿里云
技术前沿:ISP芯片终极进化——VP芯片(AI视觉处理器)
1.计算机视觉的定义 广义与狭义 从广义上说,计算机视觉就是"赋予机器自然视觉能力"的学科.自然视觉能力,就是指生物视觉系统体现的视觉能力. 从狭义上讲,计算机视觉是以图像(视频)为输入,以对环境的表达和理解为目标,研究图像信息组织.物体和场景识别.进而对事件给予解释的学科. 狭义 定义:一个通过技术帮助计算机"看到"并理解数字图像内容的研究领域,例如理解照片和视频的内容. 2.与计算机视觉密切相关的概念与计算机视觉密切相关的概念有机器视觉,图像处理与分析,图像和视
视觉SLAM技术应用
视觉SLAM技术应用 SLAM技术背景 SLAM技术全称Simultaneous localization and mapping,中文为"同时定位与地图构建".SLAM可以在未知的环境中实时定位自身的位置,并同时构建环境三维地图,是计算机视觉领域以及机器人领域中非常关键的一项技术,有着非常广泛的应用,例如VR.AR.机器人.自动驾驶等领域. SLAM技术在机器人领域应用广泛,可以采用各种各样的传感器,例如激光雷达,深度摄像头,单目.双目.多目摄像头,惯性传感器等等. 根据传感器的信息
(转) SLAM系统的研究点介绍 与 Kinect视觉SLAM技术介绍
首页 视界智尚 算法技术 每日技术 来打我呀 注册 SLAM系统的研究点介绍 本文主要谈谈SLAM中的各个研究点,为研究生们(应该是博客的多数读者吧)作一个提纲挈领的摘要.然后,我们再就各个小问题,讲讲经典的算法与分类. 1. 前言 在<SLAM for Dummy>中,有一句话说的好:”SLAM并不是一种算法,而是一个概念.(SLAM is more like a concept than a single algorithm.)”所以,你可以和导师.师兄弟(以及师妹,如
使用Minifly打造基于视觉感知的跟踪无人机
前言:无人机和人工智能现在是非常热门的话题,将两者结合起来是一个比较好的创意,本文介绍一种可行的解决方案来实现基于视觉感知的跟踪无人机.从零开始搭建无人机系统工作量和难度(以及钱)都是非常大的,所以在无人机系统的选择上,选用正点原子开发的开源算法无人机Minifly四轴和摄像头.视觉感知模块(目标检测与跟踪)采用OpenCV + MobileNet SSD + KCF. 请移步http://www.openedv.com/thread-105197-1-1.html了解更多关于Minifly相关
高德地图首席科学家任小枫QA答疑汇总丨视觉+地图技术有哪些新玩法?
上周,阿里巴巴高德地图首席科学家任小枫在#大咖学长云对话#的在线直播活动上就计算机视觉相关技术发展以及在地图出行领域的应用与大家做技术交流,直播间互动火爆,尤其在QA环节,学弟学妹们纷纷就感兴趣的视觉应用.AR导航.定位技术.5G.职业发展等话题提问,任小枫做了精彩回答.我们整理了问答内容,分享给大家. 视频回放地址: https://vku.youku.com/live/ilproom?id=8064786 任小枫博士,现任阿里巴巴高德地图首席科学家,研究员,主要负责视觉技术在地图和出行领域的
Unity3D学习(五):实现一个简单的视觉感知
前言 在很多第一人称或者第三人称射击游戏的单人模式中,玩家的乐趣往往来源于和各式各样的AI敌人的战斗.而战斗的爆发很多时候是因为这些AI在"看见"玩家后就会立即做出反应,比如开火.呼叫同伴.躲藏或者逃跑等. 所以这些AI到底是如何探测,或者说"看到"玩家位置的? 别人的例子 参考了知乎 给猫看的游戏AI实战(二)视觉感知初步 这篇文章. 这篇文章中,原作者让玩家站在敌人的角度来探测目标,它通过向正前方一定扇形区域发射一堆射线来探测目标的位置,如下图: 这种方法虽然实
游戏AI之感知(1)
目录 感知 视觉感知 听力感知 其它感知 实现 感知 视觉感知 视觉感知是一种常见的感知. 在许多即时战略游戏或者类DOTA游戏里,一个单位的视觉感知往往是圆形范围的. 当然在其他大部分俯视角游戏里,一个智能体的视觉感知应该是类似现实人眼观看的扇形范围 对于横板游戏,可以把视野"竖"起来,检测方式无多少差别. 对于空间更加复杂的3D游戏,可能需要视锥体(立体)检测. 潜在的优化是照样做成扇形检测,只是再额外增加高度差检测(即看作2.5D处理). 但是视野实际还需考虑阻挡问题. 这里提供
AI动作捕捉技术,会让制造业大幅度降低成本吗?
现代动作捕捉系统应该是起源于100多年前的动画工业,通过一种叫做"动态遮罩或影像描摹"的技术,动画师们可以获得流畅的.栩栩如生的动作:后来到了20世纪80年代,动画师们设计出带有活动标记的紧身衣,配上大型的摄像机来追踪演员的动作,进而生成比放射性条图更详细.更精确的数字图像:随着新技术不断涌现,动作捕捉日益精进,现在已然发展成动作捕捉体系:现场女性演员,身穿动作捕捉套装和面部识别装置,作为捕捉体系内的原动力,女演员可以即兴表演,也可以走到舞台新的地方,表达任何想说的话,做出或兴奋或悲伤
人工智能AI智能加速卡技术
人工智能AI智能加速卡技术 一. 可编程AI加速卡 1. 概述: 这款可编程AI加速器卡具备 FPGA 加速的强大性能和多功能性,可部署AI加速器IP(WNN/GNN,直接加速卷积神经网络,直接运行常见的网络框架),为应用和加速器函数开发人员提供了完整的开发工具SDK,节省开发时间,支持在多个平台上重复使用代码.凭借PCIe插槽外形.低功耗和被动式散热器,可以部署在各种服务器上.采用Xilinx Ultrascale VU7P /VU9P FPGA 的多功能可编程加速卡,适用于许多细分领域,如大
思迈特软件Smartbi:传统BI被“革命”,AI是BI技术未来的发展趋势
根据IDC报告,2020年中国BI软件存量市场规模为38.2亿元,到2024年,市场规模将达到78.5亿元,未来4年整体市场年复合增长率(CAGR)为19.2%.此外,还有规模达到100亿元的增量市场和数百亿元的潜在市场. 我们知道,商业智能(BI)是由Gartner公司于1996年提出的概念:BI描述了一系列的概念和方法,通过应用基于事实的支持系统来辅助商业决策的制定. BI是对商业信息的搜集.管理和分析过程,其目的是使企业的各级决策者获得知识或洞察力,促使他们做出对企业更有利的决策.BI系统
【将门创投】AI 往期技术分享
计算机视觉 1. 嘉宾:商汤科技CEO 徐立 文章回顾:计算机视觉的完整链条,从成像到早期视觉再到识别理解 2. 嘉宾:格灵深瞳CTO 赵勇 文章回顾:计算机视觉在安防.交通.机器人.无人车等领域的应用 3. 嘉宾:上交大教授 马利庄 文章回顾:可视媒体大数据的智能处理技术与应用 4. 嘉宾:阿里资深总监 华先胜 文章回顾:图像搜索的前世今生 5. 嘉宾:杨安国 DeepSee CEO 主题:如何让飘在半空的计算机视觉技术与需求落地? PDF:http://pan.baidu.com/s/1bp
AI 语音对话技术
机器学习以及自然语言处理技术的进步,开启了人与人工智能进行语音交互的可能,人们透过对话的方式获取信息.与机器进行交互,将不再只是存在科幻情结当中.语音交互是未来的方向,而智能音箱则是语音交互落地的第一代产品. 一.语音交互流程简介 AI 对话所需要的技术模块有 4 个部分,分别为: 自动语音识别(Automatic Speech Recognition, ASR) 自然语言理解(Natural Language Understanding, NLU) 自然语言生成(Natural Languag
AI创业的技术方案选择
观察了许多初创公司技术方案的选择,我总结基本遵循8个字:快速灵活,物美价廉.我们也应该根据自身实际情况,跳出束缚与时俱进,选择智能互联网时代最有力的技术和工具. 基础编程语言 候选者:C#/C++/Python C#相比Java语法更先进,生产力在各种语言中名列前茅.Java虽然在大型架构中有人才和框架的优势,但对初创公司来说还很遥远.由于.NET平台开放时间太短,目前框架特别是人工智能框架太少. C++在高性能开发中仍然不可或缺,尤其在人工智能方面,但我们目前还以运用开源的AI框架为主,暂不深
一种新的UI测试方法:视觉感知测试
什么是视觉测试 视觉测试(Visual Testing),主要检查软件用户界面(UI)是否正确显示给所有用户.它检查网页上的每个元素的形状.大小和位置是否符合预期,还检查这些元素是否在不同的设备和浏览器上是否兼容,不同的环境.不同的屏幕大小和其他影响UI显示的因素是否会影响产品的使用.视觉测试是解决 GUI 测试的一种测试手段. 为什么需要视觉测试 比如,我们开发了一个在线商城.第一次测试的时候所有的功能都能正常运行,但是当部署到另一个测试环境时,就有可能出现以下情况,这些都是因为界面布局 bu
LabVIEW图形化的AI视觉开发平台(非NI Vision),大幅降低人工智能开发门槛
前言 之前每次进行机器学习和模型训练的时候发现想要训练不同模型的时候需要使用不同的框架,有时候费了九牛二虎之力终于写下了几百行代码之后,才发现环境调试不通,运行效率也差强人意,于是自己写了一个基于LabVIEW的机器视觉工具包,让编程变得更简单便捷的同时,还能够使用多种框架和硬件加速. 一.工具包内容 此人工智能视觉工具包主要优势如下: **1. 图形化编程,无需掌握文本编程基础即可完成机器视觉项目. 多种摄像头数据采集和矩阵计算. 数百种图像算子的调用. 提供tensorflow.pytorc
Visual C++ 打印编程技术-内存设备环境
1.内存设备环境 内存设备环境是一个没有设备与它联系的环境.一般利用与某个标准设备环境兼容的内存设备环境把一个位图复制到屏幕上去.为此可以先创建一个与某个标准设备环境兼容的内存设备环境,然后把所要显示的位图复制到内存设备环境中,最后再从内存设备环境复制到真实的设备环境,从而把位图显示出来. eg: void CMainFrame::OnBitmapDraw() { CDC* pCDC=GetDC(); //获取当前设备上下文 CBitmap bitmap; //定义CBitmap对象 bitma
深入理解Linux网络技术内幕——设备的注册与初始化(二)
设备注册于设备除名 设备注册与设备除名一般有 register_netdev和unregister_netdev完成.这两个是包裹函数,负责上锁,真正起作用的是其调用的register_netdevice和unregister_netdevice.参见:net/core/dev.c. 下图描述了设备注册过程中的一些状态变化 状态的改变会用到UNINITIALIZED和REGISTERED之间的状态REGISTERING.这些进程有netdev_run_todo进行.参照"
Spring Aware容器感知技术
Spring Aware是什么 Spring提供Aware接口能让Bean感知Spring容器的存在,即让Bean可以使用Spring容器所提供的资源. Spring Aware的分类 几种常用的Aware接口如下. Aware接口 说明 ApplicationContextAware 能获取Application Context调用容器的服务 ApplicationEventPublisherAware 应用事件发布器,可以用来发布事件 BeanClassLoaderAware 能获取加载当前
spring扩展点之四:Spring Aware容器感知技术,BeanNameAware和BeanFactoryAware接口,springboot中的EnvironmentAware
aware:英 [əˈweə(r)] 美 [əˈwer] adj.意识到的;知道的;觉察到的 XXXAware在spring里表示对XXX感知,实现XXXAware接口,并通过实现对应的set-XXX方法,然后就可以使用XXX了. 通俗的解释:如果在某个类里面想要使用spring的一些东西,就可以通过实行XXXAware接口告诉spring,spring会到最后给你送过来,而接收的方式是通过实现接口唯一的方法set-XXX.比如,有一个类想要使用当前的ApplicationContext,那么我
基于百度AI人脸识别技术的Demo
编写demo之前首先浏览官方API:http://ai.baidu.com/docs#/Face-API/top 下面是源码: package com.examsafety.test; import com.examsafety.test.baiduAi.Base64Util; import com.examsafety.test.baiduAi.FileUtil; import com.examsafety.test.baiduAi.HttpUtil; import net.sf.json.J
热门专题
powerdesigner 快速增加公共字段
python tkinter 小工具
electron Menu 跳转 vue
springjunit4classrunner测试案例
openwrt 路由模式 nat模式
fireFox下用什么替代IE的ActiveXObject
开源yaml接口测试平台
使用redis网站cpu高
kaili安装adb
log4j 日志格式详解 %log{
react form置空
vim如何去引入的文件
划分3个主分区,各5GB,剩余空间作为扩展分区
re从右向左匹配第一个
mac 使用管理员启动某个app
为什么不能为HL打开一个新任务
oracle 排查undo使用率高
javascript 系统时间分秒时
SAS2308直通卡配置
linux重启network后ip