简介:数据挖掘技术能够帮助我们从规模庞大、内容纷繁的文本数据中准确、高效地提炼出研究者难以通过遍览有效捕捉的隐含信息或趋势。其中,词频统计帮助我们获取分析对象的词汇总量、高频词汇以及词汇构成等信息,并据此对文体特征进行较为准确的判断。词表比对揭示了对象文本的叙事方式、所含关键人物、场所和物品等。词语共现网络使我们能够直观地观察到文本中的高频人物、组织等,并揭示这些热词之间的潜在联系,从而快速构建热点事件的基本框架。而通过计算共现强度,我们可以轻松、准确地挖掘出与特定关键词关系密切的共现词,从而有效捕捉与之相关的热点话题和媒体动向。
简介:在描述一个事件时,说话人可以用多种方式表达他对事件参与者的态度(或曰拍摄角度)。譬如有这样一个情境,一位名叫John(约翰)的大学生打了他的室友Bil(l比尔),说话人可以用以下方式进行描述:(1a)JohnhitBil(l约翰打了比尔);(1b)Johnhithisroommate(约翰打了他的室友);(1c)Bill'sroommatehithim(比尔的室友打了他);(2a)BillwashitbyJohn(比尔被约翰打了);(2b)Billwashitbyhisroommate(比尔被他的室友打了);(2c)??John'sroommatewashitbyhim(??约翰的室友被他打了)。这些句子的逻辑内容完全相同,但在拍摄角度上各有差异。尤其需要注意的是(2c)为边缘句,或者说只有在特殊条件下才成立。本文首先构建一套制约句子生成的拍摄角度原则,然后考察不同的英语句式,这些句式如果不使用这些原则就无法解释它们成立或不成立的原因。我们还将说明(i)日语能够使用各种语法手段明确指定说话人在生成句子时所采用的拍摄角度,而且(ii)日语在某些特定条件下必须使用这样的手段。本文最后将讨论拍摄角度原则的跨语言特征,尽管这些原则在句法中起作用的场合会因语言而异。
简介:"在日"文学是指日本殖民朝鲜半岛时期(1910~1945)来到日本或被强行带到日本的朝鲜人主要用"日语"创作的文学总称。这些文学围绕着1945年8月5日朝鲜"解放"后仍残留于日本的朝鲜人不回国的理由、战后朝鲜半岛的南北分裂状况以及日本社会存在着的"民族(朝鲜人)差别"等问题,追问自我民族身份而创作的小说、诗歌和短歌等。以最初获得芥川奖的李恢成为首,"在日"作家历经第一世代(朝鲜半岛出生)、第二世代(日本出生)、第三·第四世代(父母及作家本人均日本出生)四个文学世代的历史,在日本战后文学史中占有一席之地。然而,在战后70多年的当今,"在日"文学如何坚守自我的民族身份,在日本现代文学中占据怎样的位置,又将走向何方等,伴随着第一世代文学者的相继故去,第三、第四世代文学者肩负着重要的课题。