论文阅读 | A Just and Comprehensive Strategy for Using NLP to Address Online Abuse

论文地址:https://arxiv.org/abs/1906.01738

作者 : David Jurgens, Eshwar Chandrasekharan, Libby Hemphill

机构 : University of Michigan, Georgia Tech

 

研究的问题:

本文首先讨论了什么是网络暴力行为(online abusive behavior),比如骚扰、仇恨言论、恶意挑衅,作者认为需要重新地思考什么是网络暴力行为。同时,作者认为NLP社区应当积极主动地开发各种技术,来帮助在网络暴力行为发生之前阻止。最后,我们应该重新审视我们的目标,来实现真正的正义,而不是简单地阻止网络暴力行为的发生。

 

研究方法:

重新思考什么是网络暴力行为:

在当前,NLP的识别关注范围比较小,比如一些脏话。NLP应当拓展它的计算能力,来识别另外两种常见的暴力行为:

(1)身体上的威胁

(2)更常见但比较微妙的暴力(common but subtle)

下面概述作者为其定义的三个关键方向:

(1)网络暴力的身体威胁。作者讨论了三种情况,

第一种,某些言论在场景下是无害的,在另一个场景下就是危险的。比如一个人鼓励别人给自己的政治代表打电话,这时贴出来电话号码是可以的,但如果贴出来一个普通人的电话,就涉嫌违反隐私。

第二种,在公共社交媒体上的贩卖人口信息、恋童癖信息,需要进行识别。

第三种,煽动平民产生暴动,比较一些假新闻。

(2)微妙的网络暴力(subtle abuse)

一些网络暴力在语言上比较微妙含蓄。尽管比较含蓄,对于某些敏感的人来说也很难受。这里讨论了两种研究方向:

第一种,通过自然语言理解技术,以及常识推理来识别。

第二种,关注少数群体的不平等性,比如黑人。

(3)需要尊重社区规范。

需要更多地考虑一些特殊的社区规范,比如在有的地方,使用全大写字幕等同于大喊大叫。

同时,作者提出了NLP任务的一些要求:

(1)NLP任务应在数据注释中准确定义暴力行为。

(2)解决数据稀缺的问题。

(3)考虑模型的使用对象。

预防暴力行为的方法:

现在的方法大多是在亡羊补牢,更好的方法是防患于未然。作者提出了三种方法。

(1)引导谈话的方向,远离辱骂。

(2)预测对话是否会走向暴力行为。

(3)改写有冒犯的文字。

NLP的正义框架:

NLP应考虑三种类型的正义:

(1)社会正义:描述什么行为是允许和鼓励的

(2)恢复性正义:如何处理错误行为

(3)程序正义:应当遵循什么程序

评价:

ACL2019的论文。全篇没有一个公式,没有一张表,只有一张图的一篇论文。总的来说,提出了很多关于网络暴力行为的定义和思考。我只知道,这篇论文的作者如果换成我一定中不了(手动狗头

posted @ 2020-04-21 22:54  bernieloveslife  阅读(210)  评论(0编辑  收藏  举报