独特的挑战

A comprehensive repository of Taiwan's data and information.
Post Reply
Bappy11
Posts: 449
Joined: Sun Dec 22, 2024 6:04 am

独特的挑战

Post by Bappy11 »

长期以来,文本一直是社会科学家的重要数据来源,但使用起来却很困难。例如,当我撰写博士论文时,我花了数周时间研究《纽约时报》的摘要——查找与过去总统竞选有关的报纸文章,并对这些文章进行内容分析,以确定其中是否包含实质性信息或“选马”信息。过去,大多数学者都是手动分析这样的文本,尽管有大量文本可供研究,但这些信息中只有极少数可以成为适合进行复杂定量分析的数据。

世界发生了多大的变化!由于计算能力(包括数据可访问性、存储和分析能力)的巨大进步,用于自动分析文本的工具和方法激增。一些最具创新性的新工具和方法正在由社会科学家开发,近年来,我们看到许多关于文本分析的重要论文发表在《政治分析》上。

该领域的一个重要发展是结构主题模型。这种文本分析方法最近发展迅速,我请 兼职数据 《比较政治学的计算机辅助文本分析》的作者(Christopher Lucas、Richard A. Nielsen、Margaret E. Roberts、Brandon M. Stewart、Alex Storer 和 Dustin Tingley)更详细地讨论他们的论文及其对该领域的贡献。他们的论文如下。

* * * * *

比较政治文本分析
作者:克里斯托弗·卢卡斯、理查德·A·尼尔森、玛格丽特·E·罗伯茨、布兰登·M·斯图尔特、亚历克斯·斯托勒和达斯汀·廷利

每两天,人类产生的文本信息量就比自有记载的历史之初到 2003 年人类总产量还要多。这些文本中的大部分都与政治学问题直接相关。政府、政客和普通公民经常以书面形式交流他们的想法和意见,提供新的数据来了解政治世界,并为以前被认为难以解决的领域提供新的研究途径。然而,为了获取这些文本数据的价值,我们需要进行有原则、有系统的分析的方法。
Post Reply