返回

超级U盘

首页
关灯
护眼
字体:
第244章 生日礼物(第3/8页)
   存书签 书架管理 返回目录
一代技术,只能识别同一图像不同尺寸的衍生图片,以及大部分内容相似的图片,并没有实装图像内容识别技术。

    反而是内容识别技术被他们用做内容过滤引擎,封杀恶意广告、反黄反暴力,能够有效防止搜索结果里面出现国家法律禁止出现的内容,或者可能损害用户利益的欺诈内容。普通用户对于这项藏于后台的技术没有多少感觉,只是单纯感觉钓网搜索的内容比较干净,没有恶意广告以及很黄很暴力的图片和文字。

    虽然一直有批评的声音认为钓网管得太宽,内容过滤太严重,没有提供给用户“原汁原味”的搜索结果让用户去自主选择,失去了工具的中立性。但钓网依旧我行我素,即使被很多中小站点禁止搜索引擎收录也坚持不改。

    时间久了,除了在这里找不到波多野结衣新片下载地址的****自觉远离以外,普通用户开始慢慢开始习惯了“钓”按钮的一键直达和“网”按钮的一页精选,当初封杀禁止钓网的网站也开始解禁,允许钓网的搜索机器人程序自动收录他们网站的网页,编制索引。

    常规的文件特征值识别技术对于相同或者相似度高的图片具有很好的识别效果,比如使用相机三连拍功能拍摄连续动作,得到变化幅度很小的几张照片,特征值识别技术就能很好的把它们找出来;但是对于这张图片到底是什么内容,这种技术就无能为力了,计算机界一直都在研究内容识别技术,试图识别出不同图像内蕴含的信息,比如识别出同一个人穿着不同衣服,在不同光线环境和背景条件下拍摄的照片。通常使用海量训练法,让识别程序建立一个覆盖几千万甚至几亿张图片的数据库,通过人工辅助纠错的方式维护这个数据库,然后软件再依靠这个数据库去按图索骥。

    不过这种死板低效率的方法在信息大爆炸的当下,无异于以杯水救车薪之火。

    单是用户上传到花园相册的照片,早已经突破了10亿,在“ta是”发布时全站图片数量已经达到18亿,并且因为“全民调戏ta”的关系短

-->>(第3/8页)(本章未完,请点击下一页继续阅读)
上一页 目录 下一页