数字人文(digital humanities)是什么?

   2023-09-21 09:08:07 50
核心提示:一种解释:如果让我来定义,我认为它是以人文问题为目的、以电子信息技术为手段的问题解决方案。 几个实例 首先我想引用两个《导论——什么是数位人文》中的例子(见图)。在这个例子中,涉及到了词语的检索,中英文遇到了各自不同的问题,英文中,不同的词有不同的形式,同一个词进行变化会改变其词性。而在中文的角度——

一种解释:如果让我来定义,我认为它是以人文问题为目的、以电子信息技术为手段的问题解决方案。

几个实例

首先我想引用两个《导论——什么是数位人文》中的例子(见图)。

在这个例子中,涉及到了词语的检索,中英文遇到了各自不同的问题,英文中,不同的词有不同的形式,同一个词进行变化会改变其词性。而在中文的角度——怎样算是一个“词”?比如“数位人文”按照语义应当拆分为“数位”和“人文”,而“位人”则没有任何意义。详细的解决方法暂不赘述,从这个例子中我们可以看出语言(文字)是连接计算机和人文的内容媒介,同时也可以意识到中国的数字人文研究必须要有对中华文化和汉语深刻理解的人来完成。

第二个例子则是一种由定量到定性的分析,通过大量的数据来得出较为确定的结论。其实,这有些像当下正火的“大数据分析”。

第三个例子较为复杂,它更多的是语言学方面的研究,理解起来有一定的难度。(ViaDHQ 2016.10.4 Language DNA: Visualizing a LanguageDecomposition)下面我作大致解释:该研究团队将英语的全部单词计入,每个单词拆分为两个字母一组,分别对应到x轴和y轴,进而用颜色的深浅(点的密集程度)来表现词语的构成。

他们将其称作L-DNA。然而对于其具体应用,论文中并没有有力的解释。尽管从这些可视化图形中,我们可以直观地分析出语言学方面的结论,譬如特定的音素会有规律地放在特定的位置。换言之,可视化的方法仅仅是方便数据的获得,并不会直接产生突破性的结论,而后者的有无则要靠人文学者的智慧。

以下是其结论(Conclusion):

L-DNA具有以下重要特征:

L-DNA空间能够处理从空字符串到无限长字符串的任何符号串。L-DNA可用于1,2或n维。在空间中的任何两个点(单词)之间,L-DNA空间是无限的,存在另一个单词 - 虽然它可能没有语义意义。L-DNA空间是一对一的(双射)。每个独特的编码映射到唯一的位置,反之亦然,可以从视觉空间中唯一地恢复单词(或任何原始信息)。

根据其结论3,我们可以采用这个编码方式,借助合适的实体媒介(比如生物材料),来保存我们的语言。当然,以中文为代表的的象形文字则需另辟蹊径。

通过三个实例,我们容易发现数字人文并没有固定地研究对象,即一切人文学科甚至泛人文学科皆为其研究对象,并且数字化的方法也是多种多样。

12.25更

关于数字人文的话,个人认为它跟自然语言处理还是有区别的。未来若跟人工智能算法结合也是很有趣的事情。然而国内目前似乎很少有研究室在搞...丧。

2020.10.31更

好像今年人大开始招这个方向的研究生了~

我这个回答是两三年前的了,很多信息可能陈旧了些,总的来说随着deep Learning在cv上日趋饱和,nlp也逐渐开始找新的田地了,哈哈哈哈。这个回答应该也没必要继续更新了,因为信息越来越对称了,希望国内这个领域能慢慢做起来!

 
举报 0 收藏 0 打赏 0评论 0
标签: sdf

免责声明:本站部份内容系网友自发上传与转载,不代表本网赞同其观点。如涉及内容、版权等问题,请在30日内联系,我们将在第一时间删除内容!

在线
客服

在线客服服务时间:8:30-5:30

选择下列客服马上在线沟通:

客服
热线

微信
客服

微信客服
顶部