最新专著《机器视觉及深度学习——
经典算法与系统搭建》出版发行
前 言
机器视觉及深度学习是人工智能的主要技术手段,已经广泛应用于各个领域。传统机器视觉技术,一般需要有较深的研发经验,才能进行相关应用项目的开发,处理算法的通用性较差,学习门槛较高。深度学习需要搭建很多神经网络层次结构,一般人不具备搭建深度学习框架的能力,好在有不少大公司和专业机构根据不同的需求设计了一些深度学习框架并对外开放,一般人可以利用这些深度学习框架,实现自己的图像检测目的,学习门槛较低。
在功能方面,传统机器视觉技术更适合精确检测与定位,处理速度快,对硬件处理能力要求不高。深度学习更适合目标分类,需要对大量检测目标样本进行训练,处理量大,自然环境下的检测精度一般在80%左右,需要采用高性能的GPU处理设备提高检测速度。 如果能够融合深度学习和传统机器视觉技术,针对深度学习的检测结果,再通过传统机器视觉技术进行精确检测和定位,就可以大大提高AI技术的效率和精度。
为了让初学者能够通过本书的学习,理解和掌握机器视觉及深度学习的理论和编程实践,本书分上篇和下篇。上篇介绍理论算法,包括机器视觉的经典图像处理算法、深度学习的理论基础和目前深度学习框架。下篇介绍编程环境系统搭建,首先介绍机器视觉图像处理算法及深度学习的编程工具VC++、Python和OpenCV;然后利用VC++和Python工具,搭建图像处理的工程界面;最后介绍常用的9种深度学习框架获得方法、安装设置、工程创建,以及深度学习工程的编译、训练、评估与部署方法。每一个搭建的工程,都提供一套可下载的源代码例程序,方便读者下载学习。部分例程程序下载网址:www.fubo-tech.com。
本书由10位编委会成员共同完成。为了确保初学者能够按教材顺利搭建系统,作者完成编写后,由没有经验的人员根据编写材料试用并提出修改意见。为了完成深度学习框架的搭建,根据需要部分读者需要配置高性能的GPU处理器计算机。
编委会成员的具体分工如下:
陈兵旗:内容策划,编写第1章 基础知识、第2章 目标提取、第8章平台软件、第9章 VC++图像处理工程和第10章 Python图像处理工程。
梁习卉子:编写第3章边缘检测、第4章去噪声处理和第5章几何参数检测。
张亚伟:编写第6章直线检测。
刘星星:编写第7章深度学习框架介绍和第18章YOLOv4深度学习工程。
尹彦鑫:编写第11章TensorFlow深度学习工程。
胡标:编写第12章Keras深度学习工程和第17章Theano深度学习工程
苏道:编写第13章 PyTorch深度学习工程。
田文斌:编写第14章Caffe深度学习工程、第15章MXNet深度学习工程和第16章CNTK深度学习工程。
陈建:编写第19章 PaddlePaddle深度学习工程。
虽然编委会付出了很大努力,但是在内容结构和文字表述方面难免有不合理的地方,敬请批评指正。