首页 理论教育 深度学习与深度合成案例

深度学习与深度合成案例

时间:2023-11-18 理论教育 版权反馈
【摘要】:近年来深度学习技术之所以能引起社会各界广泛的关注,是因为不光在学术界,同时也在工业界取得了重大突破和广泛的应用。近年来,随着卷积神经网络、循环神经网络等深度学习相关技术的快速发展,深度学习在自然语言处理方面的应用也展现出了明显的优势。目前,基于深度学习的自然语言处理在文本分类、机器翻译、智能问答、智能推荐以及聊天机器人等方向都得到了极为广泛的应用。

深度学习与深度合成案例

近年来深度学习技术之所以能引起社会各界广泛的关注,是因为不光在学术界,同时也在工业界取得了重大突破和广泛的应用。其应用可分为视觉类领域(包括图像识别、视频识别、生物特征识别等)、自然语言处理领域(包括机器翻译、文本挖掘、情感分析等)和语音类领域(包括语音识别、语音合成等)等三大类。

视觉类领域是目前深度学习应用最为成熟的领域,也正是由于深度学习算法在ImageNet图像识别大赛中远超其他机器学习算法并以巨大优势夺魁才推动了人工智能发展的第三次浪潮。目前,通过卷积神经网络(CNN)构建的图像处理系统能够有效地减小过拟合,在融合GPU加速技术后,使得神经网络在实际中能够更好地拟合训练数据,更快更准确地识别图像内容。总而言之,深度学习模型可谓是和图像处理技术的完美结合,不仅能够提高图像识别的准确率,同时还可以在一定程度上提高运行效率,极大减少人力成本。目前,基于深度学习的视觉类应用包括图像识别、身份识别、人脸等生物特征识别、视频动作识别、自动驾驶医疗影像诊断、图像生成等(图1-6)。

图1-6 新冠病毒医疗影像诊断

自然语言处理(Natural Language Processing, NLP)是语言学和人工智能的交叉科学,旨在让计算机能够“读懂”人类的语言。其包括的主要范畴有:分词、词性标注、命名实体识别、句法分析、关键词抽取、文本分类、自动摘要以及信息检索等。传统的自然语言处理主要是利用语言学领域本身的知识结合一些统计学的方法来获取语言知识。后来伴随着SVM、逻辑回归等机器学习浅层模型的发展,自然语言处理领域的研究取得了一定的突破,但在语义消歧、语言理解等方面还是显得力不从心。近年来,随着卷积神经网络、循环神经网络等深度学习相关技术的快速发展,深度学习在自然语言处理方面的应用也展现出了明显的优势。目前,基于深度学习的自然语言处理在文本分类、机器翻译、智能问答、智能推荐以及聊天机器人等方向都得到了极为广泛的应用。(www.xing528.com)

语音相关的处理其实也属于自然语言处理的范畴,目前主要是语音合成(Text to Speech, TTS)和语音识别(Automated Speech Recognition, ASR)。同自然语言处理类似,语音合成和识别也是人工智能和其他学科的交叉领域,其所涉及的领域有:模式识别信号处理概率论信息论等。语音识别和语音合成为人与计算机间的交互提供了更加人性化的交流途径,但识别的准确率和合成效果一直受限于技术发展而影响了其推广应用。近年来随着深度学习技术的兴起,语音识别和语音合成技术取得显著的进步,基于深度学习的语音处理技术从实验室走向了市场,更得到了谷歌、微软、百度以及科大讯飞等众多科技公司的青睐。语音输入法、家用聊天机器人、医疗语音救助机、智能语音穿戴设备等具体的应用场景也是层出不穷。

基于这些技术,国内外众多科研人员和高科技企业开发了包括无人驾驶、智能搜索、语音助手、智慧家居等种类繁多的智能系统和产品,其中相当一部分已经进入普通百姓的日常生活中。苹果公司人工智能技术多数已经实现在其产品中,如iPhone X采用的人脸识别技术引领了智能手机刷脸认证的新变革,在Siri等语音识别应用中利用深度神经网络算法提升语音识别的准确率,在Apple Watch上采用人脸识别技术辨析用户锻炼状态等。微软致力于基于深度学习的语音识别和图像识别研究,相关成果用于微软系列产品中,如Skype即时翻译、小冰聊天机器人和小娜(Cortana)虚拟助理等。谷歌公司除了引人注目的AlphaGo以外,一直是无人驾驶车研发的领军人物。早在2015年,其外形酷似熊猫的无人驾驶车已经行驶在加利福尼亚州芒廷维尤的街头,三年后,谷歌的无人驾驶车已经初步实现商业化运营(图1-7)。我国的人工智能技术创新主要以百度、阿里腾讯、科大讯飞和商汤集团为首,这五家企业被列入科技部公布的国家新一代人工智能开放创新平台,其中百度以深度学习技术为核心进行多领域的应用开发,包括自动驾驶、语音识别、图像识别、自然语言处理等多个领域,阿里和腾讯主要以智能公共系统和医疗影像拓展人工智能应用领域为主要工作方向,科大讯飞公司则致力于智能语音及语言技术研究,其开发的智能语音识别系统已经成功应用于车辆、手机等各种产品。商汤集团关注于包括人脸识别、图像识别、文字识别、图像视频分析、自动驾驶、医疗影像识别等各类智能视觉技术。

图1-7 谷歌无人驾驶车

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈