论文阅读 | A Just and Comprehensive Strategy for Using NLP to Address Online Abuse

论文地址：https://arxiv.org/abs/1906.01738

作者： David Jurgens, Eshwar Chandrasekharan, Libby Hemphill

机构： University of Michigan, Georgia Tech

研究的问题：

本文首先讨论了什么是网络暴力行为（online abusive behavior），比如骚扰、仇恨言论、恶意挑衅，作者认为需要重新地思考什么是网络暴力行为。同时，作者认为NLP社区应当积极主动地开发各种技术，来帮助在网络暴力行为发生之前阻止。最后，我们应该重新审视我们的目标，来实现真正的正义，而不是简单地阻止网络暴力行为的发生。

研究方法：

重新思考什么是网络暴力行为：

在当前，NLP的识别关注范围比较小，比如一些脏话。NLP应当拓展它的计算能力，来识别另外两种常见的暴力行为：

（1）身体上的威胁

（2）更常见但比较微妙的暴力（common but subtle）

下面概述作者为其定义的三个关键方向：

（1）网络暴力的身体威胁。作者讨论了三种情况，

第一种，某些言论在场景下是无害的，在另一个场景下就是危险的。比如一个人鼓励别人给自己的政治代表打电话，这时贴出来电话号码是可以的，但如果贴出来一个普通人的电话，就涉嫌违反隐私。

第二种，在公共社交媒体上的贩卖人口信息、恋童癖信息，需要进行识别。

第三种，煽动平民产生暴动，比较一些假新闻。

（2）微妙的网络暴力（subtle abuse）

一些网络暴力在语言上比较微妙含蓄。尽管比较含蓄，对于某些敏感的人来说也很难受。这里讨论了两种研究方向：

第一种，通过自然语言理解技术，以及常识推理来识别。

第二种，关注少数群体的不平等性，比如黑人。

（3）需要尊重社区规范。

需要更多地考虑一些特殊的社区规范，比如在有的地方，使用全大写字幕等同于大喊大叫。

同时，作者提出了NLP任务的一些要求：

（1）NLP任务应在数据注释中准确定义暴力行为。

（2）解决数据稀缺的问题。

（3）考虑模型的使用对象。

预防暴力行为的方法：

现在的方法大多是在亡羊补牢，更好的方法是防患于未然。作者提出了三种方法。

（1）引导谈话的方向，远离辱骂。

（2）预测对话是否会走向暴力行为。

（3）改写有冒犯的文字。

NLP的正义框架：

NLP应考虑三种类型的正义：

（1）社会正义：描述什么行为是允许和鼓励的

（2）恢复性正义：如何处理错误行为

（3）程序正义：应当遵循什么程序

评价：

ACL2019的论文。全篇没有一个公式，没有一张表，只有一张图的一篇论文。总的来说，提出了很多关于网络暴力行为的定义和思考。我只知道，这篇论文的作者如果换成我一定中不了(手动狗头

posted @ 2020-04-21 22:54 bernieloveslife 阅读(210) 评论(0) 编辑收藏举报

刷新页面返回顶部

bernieloveslife

论文阅读 | A Just and Comprehensive Strategy for Using NLP to Address Online Abuse

公告