“‘维科杯’·OFweek 2020(第五届)人工智能行业年度评选”活动由高科技行业门户OFweek维科网主办,OFweek人工智能网承办,活动旨在表彰人工智能领域具有突出贡献的优秀产品、技术及企业,鼓励更多企业投入技术创新;同时为行业输送更多创新产品、前沿技术,一同畅享人工智能的未来。
2020人工智能行业年度评选“OFweek (5th.) AI Awards 2020”将于2020年9月21日-10月10日进入网络投票阶段,颁奖典礼将于10月28日在深圳举办。
目前,活动正处于火热的报名评审阶段,业内企业积极响应。广州图普网络科技有限公司已正式参评“维科杯·OFweek2020(第五届)人工智能行业优秀产品应用奖”。
图普科技创立于 2014 年,是一家专注人工智能视觉识别技术的国家高新技术企业,依托先进的人工智能和计算机视觉技术,迅速落地包括互联网|融媒体图像智能审核、新零售商业智能管理和泛安防三大领域应用实践。目前,图普科技图像识别云服务平台日均调用量达 20 亿次以上,是国内最大的第三方图像识别云平台。
参评技术:基于深度学习和大数据的智能内容识别云平台
2014年初,图普科技创立,基于快播事件启发,创始人李明强先生带领团队开创新性打造了基于人工智能深度学习的内容审核产品,巧妙地将图像识别融入鉴黄领域,并于2015年正式上线。
核心技术介绍:
图普AI 内容识别云平台利用领先的自研图像识别算法、自然语言处理算法以及语音识别算法,结合海量的数据进行建模,可对互联网及融媒体平台中的图像、文本、语音内容进行智能审核、过滤,同时根据用户阅读习惯进行精准推荐,并可针对平台风格及需求进行审核、过滤、推荐规则定制化。
目前图普AI审核服务维度包括色情、暴恐、涉政、敏感、广告、低俗、违法违规、谩骂、灌水等。通过主动学习大数据标注方法和系统的深度学习算法,利用模拟人脑神经网络构建模型,平台能够对高复杂度数据形成良好解读。通过大数据持续训练、频繁迭代,图普科技的图像识别分析系统的内容审核产品的精确度超过99.5%,违规内容过滤召回率超过95%,同时在识别的范围广度、标签细粒度、标准严谨度上,也有了大幅度提升。例如,图普色情识别产品在色情、性感和正常的三个分类基础下,已经拓展到了30多个二级细分标签,为客户提供更好地识别体验。
同时,图普AI内容识别云平台,还能基于图像、文本及语音的识别技术,提供内容增值服务。包括基于图像识别的OCR识别、人脸特征及表情识别服务定制、物体场景识别、图像风格转化,基于语音识别的声纹识别、音频特征识别等,以及视频搜索匹配与热点视频统计服务等。
其设计应用或创新的关键点:
(1)人工智能算法在内容审核方向的创新性应用
图普科技是国内最早将人工智能深度学习技术应用于互联网内容审核的企业。基于大数据标注技术,先进的图像识别标注算法,为高并发图像识别提供技术支持,审核产品精确率达到99.5%,节省超过90%人工复审工作。
目前传统的图像审核方式主要有三种:一种是纯人工审核,人眼鉴别图片或视频是否违规。二是建立MD5数据库。网监建立存储违规图片、视频的MD5数据库,用户上传后自动分析MD5是否合法,则可避免涉黄内容重复分享。三是传统的智能审核。如识别色情图像,基本是通过图片RGB值识别肤色比例、通过建模识别异常动作、敏感部位等。
三种审核方式都存在较大漏洞:人工识别审核效率低、误判漏判多等主观性问题;MD5则非常容易被篡改;传统智能识别色情图片准确率低、经常误报等。而以图普科技为代表的互联网图像内容审核专家,主动学习大数据标注方法和系统的深度学习算法,通过模拟人脑神经网络构建模型,能够对高复杂度数据形成良好解读。通过大数据持续训练、频繁迭代,图普科技的图像识别分析系统的内容审核产品的精确度达到99.5%,节省超过90%的人工复审工作。
基于图像识别云平台服务,图普科技已获得了包括“主动学习大数据标注方法和系统”、“实时视频流转码方法、装置及计算机可读存储介质”、“基于深度学习的人工智能色情图像识别技术”、“ 图普暴恐图像识别软件”、“ 图普政治人物识别软件”在内的多项研发知识产权。
(2)关键技术创新:
①基于关联建模的图像自动标注方法
视觉大数据深度学习一个首要关键问题是图像标注。图像标注方法可分为有监督的分类算法和关联建模。有监督的分类算法是一种最直接的图像标注方法。有监督的分类算法将各个语义类别(一个关键词或关键词集合)看作独立的概念,通过训练一组经过语义标注的样本图像,为每个语义类别建立各不相同的二类分类器,然后利用分类器将未标注或未归类的图像归并到某一语义类。关联建模的方法从文本领域的研究得到启发。这类方法利用现有的标注好的图像数据集,在无监督的基础上学习图像的视觉特征和文本关键词之间的关联,然后通过统计推理的方法将这种关联应用到未标注的图像。图像自动标注方法基于关联建模的思想,同时使用标注图像及其关键词和未标注图像估计隐空间的分布,学习视觉模态和文本模态之间的关联,从而能够较好地对未知图像进行标注。
②开发首个商用的互联网视觉大数据实时智能计算云平台
视频内容需要实时监测控制,因此对处理速度等指标有很高的要求。然而视频相比于图像是一个更高维的信号,不仅数据规模庞大,更重要的是还具有高并发、高维度、大流量的显著特性。比如,在网络视频内容监管中,流量通常高达每秒几GB甚至几十GB。图普科技与浙大国家重点实验室合作,依托“天河二号”国家超级计算广州中心,搭建并开放了国内首个图像识别云平台。通过自主搭建的高并发和负载均衡的云平台,将图像合理的自动分配服务器处理集群处理,保证图像识别平均响应时间小于1s/张,可用率达到99.9%。并与超算中心联手建立了超算混合云方案以有效应对高并发数据峰值,节约了30%以上的技术成本。
③平台采用开放式接口,支持高并发、海量图片和视频实时接入
云平台提供API开放接口,支持高并发海量数据的接入。同时,平台服务支持多维度实时数据识别处理,可同时处理多种类型的识别需求,实时获取多种类型结果。灵活的模块化产品更有助于灵活定制使用方案,结合业务需求针对性地定制识别服务使用方案和产品识别逻辑,满足客户在不同业务需求。 根据不同的使用场景,图普科技的识别服务支持深度定制具有针对性的审核策略及方案,这种灵活性极大便利了客户的使用。
参选述说/理由:
移动互联网时代,UGC类产品得到空前的发展,涉及社交、新闻、音乐、直播、社区论坛等,用户原创内容超越过去简单的文字评论,扩展到文章、图片、视频、直播等多种形式和内容。也因此,互联网内容安全和反垃圾形式空前严峻,过去的人工审核已经难以适应当下的产品需求。
图普科技是国内最早将AI深度学习技术应用于互联网内容审核的企业,核心技术领先,产品体系成熟,场景应用深入,包括网络社区、视频直播、音视频网站、社交娱乐平台、融媒体、在线教育等,都有应用到图普智能识别云服务。当前,图普AI内容识别云平台,日均处理量达20亿次的级别,累计处理超过数千亿次图像。审核产品精确率达到99.5%,减少了企业90%的人工审核成本。
2015年图普图像识别云平台上线,16年已覆盖60%以上互联网直播企业。截止目前,已赢得了包括移动咪咕、中国联通、美图、哔哩哔哩、滴滴、喜马拉雅、58同城、迅雷、酷狗、秒拍、花椒直播等在内的数百家互联网企业的合作信任。
2019年,凭借在融媒体内容领域领先的技术探索,图普科技成为了光明网“全国媒体融合技术创新实验基地”共建单位,并作为唯一一家创业公司,入选了央视网“融媒智控云矩阵”合作伙伴。2019年11月,图普科技获得人民网内容科技大赛长三角赛区决赛一等奖(比赛总分第一),同场还包括数美科技等友商企业。2020年3月,图普“互联网内容AI智能审核云平台”入选广州市互联网、大数据、人工智能和实体经济深度融合应用优秀案例。
本届“‘维科杯’·OFweek 2020(第五届)人工智能行业年度评选”活动将于9月21日进入网络投票阶段,欢迎各位踊跃投票!