搜索引擎可以帮助研究人员搜索互联网上的隐私文件

   2023-06-08 https://www.dalvwang.com/爱发布1010
核心提示:丹东娱乐棋牌网一种名为自然语言处理的人工智能程序可以帮助研究人员更有效地分析在线隐私文件,从而最终研究出使网络更安全的方


o<em></em>nline Privacy

丹东娱乐棋牌网一种名为自然语言处理的人工智能程序可以帮助研究人员更有效地分析在线隐私文件,从而最终研究出使网络更安全的方法。

图片:托马斯Lefebvre / Unsplash

一款使用人工智能(AI)“阅读”数百万在线文档的搜索引擎,可以帮助隐私研究人员找到与网络隐私相关的文档。设计该搜索引擎的研究人员表示,对于试图找到设计更安全互联网的方法的研究人员来说,它可能是一个重要的工具。

在一项研究中,研究人员说,搜索引擎,他们被称为PrivaSeer,使用一种称为自然语言处理(NLP)的人工智能识别在线隐私文件,如隐私政策、服务条款协议,饼干政策,隐私法案和法律,监管准则和其他相关文献。

研究人员无需自己搜索隐私文档,只需在搜索引擎中输入他们的查询,就可以有效地识别和收集正确的文档。

不过,仿真鞋据Shomir Wilson说,最终,搜索引擎可以帮助研究人员更好地了解网络隐私的总体情况,并研究随着时间的推移,网络隐私的趋势,这可能会在某一天带来一个用户可以更安全、更安全地浏览的互联网,宾夕法尼亚州立大学信息科学与技术助理教授,计算与数据科学研究所附属机构。

“这对自然语言处理和隐私研究人员来说都是一种资源,他们对这一文本领域感兴趣,”威尔逊说。“考虑到像这样的大量文本,我们可以找到方法来识别并自动标注人们可能感兴趣的某些数据操作,然后使构建工具能够帮助用户理解在线隐私。”

NLP将语言学、计算机科学和人工智能结合在一起,为计算机编程来处理和分析大量的文本。该研究的第一作者、信息科学与技术专业的博士生穆昆德·斯里纳特(Mukund Srinath)说,在这种情况下,研究人员使用NLP从网络上收集隐私政策文件。

靖江青儿

“NLP方法可以根据文本中出现的特定词汇区分隐私策略文档和非隐私策略文档,”Srinath说。直观地说,您可以认为隐私策略中可能有一些非隐私策略中没有的词汇,比如数据保护和隐私,这只是一些常见词汇。在NLP方法中,你可以说算法学会了识别这两种不同类型文档的区别。”

他补充说,在没有机器学习的情况下,搜索和分类隐私文档将是耗时和困难的,如果不是不可能的话。

Wilson说,需要对隐私信息有更深入的了解,因为这类文档在很大程度上被普通用户忽略了。

威尔逊说:“大多数网站向你展示他们的数据操作信息,然后你应该通过实际浏览和阅读所有这些信息来表示同意。”“但没人真的这么做,因为它不实用,精仿鞋 也不符合人们使用互联网的方式。人们通常也不具备法律知识。”

这些隐私政策是由PrivaSeer搜索引擎在两次独立的网络爬行过程中收集的。网络抓取指的是通过软件程序系统地大规模浏览互联网。第一次爬行发生在2019年7月。第二次爬行发生在2020年2月。

PrivaSeer数据库现在包含了大约140万个英语网站的隐私政策。

威尔逊说:“我们的数据库的一个独特之处是,我们拥有在线隐私的单一最大快照。”

Soundarya Nurani Sundareswara,信息科学和技术的前研究生,目前是苹果公司的软件工程师,和C. Lee Giles,信息科学和技术学院的David Reese教授,都来自宾夕法尼亚州立大学,他们与威尔逊和斯里纳斯在这个项目上合作。

该团队在网络工程国际会议上发表了他们的发现。

来源:https://www.miragenews.com/search-engine-could-help-researchers-scour-651447/

 
反对 0举报 0 收藏 0 打赏 0评论 0
 
更多>同类律法百科
推荐图文
推荐律法百科
点击排行
网站首页  |  发布信息  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  陕ICP备17001588号-18
本站信息均来自互联网,以学习交流为目的,整合法律法规、互联网相关知识,不拥有所有权,不承担相关法律责任
如有侵权,请联系我们,并提交问题、链接及权属信息,本站将立刻删除