(完整版)AntConc的详细使⽤说明
AntConc3.2.0的使⽤说明11.提取语境共现1.1设置检索项(1)单项检索
a)点击file下拉菜单中的“open files”,选择要打开的语料(如果想打开整个⽂件夹,可以选择open directory);
b)在“Search Term”⼀栏键⼊要检索的词项,如go;
c)在“Search Window Size”⼀栏设置每⼀共现⾏出现的词数;d)点击,开始检索。检索结果如图1.1所⽰:
图1.1单项检索结果(2)多项检索●设置多项检索
除了检索单个词项以外,AntConc还具有检索多个词项的功能,检索⽅法为在检索项间键⼊“|”符号。例:要检索动词go的各种时态形式,可在“Search Term”中输⼊go|went|gone|goes●设置语境词检索
为了语境共现的检索,可以设定⼀个语境词在检索项周边⼀定的语境范围内出现。
例:如要研究a … of 这⼀类词组,可通过AntConc提取所有的词项,检索⽅法如下:
a)在“Search Term”⼀栏键⼊a;
b)点击“Search Term”旁的,进⼊“Advanced Search”界⾯,
如图1.2所⽰。点击“Use context words and horizons”,然后在“ContextWords”⼀栏键⼊of,点击。如要重新设置语境词,可先点击
清除原来语境词,后重复以上操作。另外,还需设定语境词距离检索项的
1此说明书由华南师范⼤学外⽂学院2007研究⽣张杏娟编写,导师何安平订正和补充。
其中限定范围的检索⽅法由⾹港城市⼤学D.Lee博⼠提供,仅此致谢。位置,如本研究中,of在a的右⼆位置,所以“Content Horizon ”确定为,最后点击;
c)回到语境共现的界⾯后,点击,开始检索。结果可提取a lot of, a bit of 等词块。●设置多字语检索
在研究中,如需检索多个词项,除了使⽤“|”以外,也可使⽤以下⽅法,尤其适合检索项数⽬较多的情况。例:研究感官动词watch, sound, feel, hear, smell
a)在TXT⽂本中键⼊所有要检索的词项,可多达250个词。然后为该⽂本起名保存。需注意:键⼊的词项需以列的形式排列。如:feelfeelsfelt
b)点击Search Term旁的,选择“Use search term(s) from list below”。点击,在保存以上新建的⽂本的盘符路径点击⽂本名,然后点击;c)回到语境共现的界⾯后,点击,开始检索。●使⽤通配符检索符号意义检索项检索结果
* 零个或多个字符book* 提取所有以book打头的词,如book、books、
booking、bookshop等*book 提取所有以book结尾的词,如book、notebook等
*book* 可以同时提取包括以上两类词
+ 零个或⼀个字符book+ 提取所有以book打头的词,但之后有零个或⼀
个字母,如book、books ?任意⼀个字符?ough 提取所有以字母组合ough结尾的,但之前有⼀个字母的词,如cough、rough等
@ 零个或⼀个词think@of 提取所有含有的词组,如think of、think highlyof等
# 任意⼀个词look# 提取所有与look的搭配,如look after、look at
等●附码检索
因研究需要,有些语料经过整理加⼯并附加上各种符号标记,称为“附码语料库”。如附有词性标注的LOBTAG和附有错误类型标记的CLEC等。检索时只需键⼊某个标记符号便可提取带附有该标码的所有词。
例:提取LOBTAG语料库中所有的名词,只需键⼊*_NN(NN为名词标码,关于其他词性的详细标记,请参阅何安平,2004,《语料库语⾔学与英语教学》⼀书的附录113页。
(4)在指定范围内检索
a) 在concordance的检索界⾯上选择\"Regex\" (regular expression),键⼊\\[.*\\] 为检索项便可提取语料库中所有在起⽌符号“[”和“]”之间的所有⽂字内容,其他符号照似类推。
b) 在concordance的检索界⾯上选择\"Regex\" (regular expression),键⼊\\[.*write.*\\] 为检索项便可提取语料库中所有在起⽌符号“[”和“]”之内的“write”
的语境共现⾏,其他词项照似类推。键⼊的检索项计较⼤⼩写,但是可以⽤通配符*。1.2分析检索结果(1)观察频数、分布
●频数即该检索项出现的次数,可在“Concordance Hits”⼀栏中获得。●点击,查看检索项在语料⽂本中的分布状况。(2)凸显周边语境词
为了具体某个教学等⽬的,可通过凸显检索项周边的某些词汇。⽅法是选择“Kwic Sort”,R1和L1分别代表检索项右⽅和左⽅的第⼀个词,⼀次可设置三列凸现词,均按字母顺序排列。检索结果如图1.3所⽰。如想使凸显内容的颜⾊⼀致,可通过设置下拉菜单中的“Color Settings”改变颜⾊。另外,
图1.4 Tool Preferences下拉菜单界⾯若要凸显的部分不是⼀个词,⽽是单词中的字母,可选择下拉菜单中的“Concordance”选项中的“Sort by characters instead of words”,如图1.4所⽰。
图1.3凸显周边语境词检索结果(3)提取搭配词表
通过点击主界⾯中的,可获得检索项的搭配词表,同时可以设置搭配词的位置、出现的最少次数与词表的排列⽅式。例:观察look右⼀的搭配词a)点击主界⾯中的;
b)在“Search Term”⼀栏键⼊look;c)设置搭配词的位置,如;
d)点击,开始检索,检索结果如图1.5所⽰。
e)点击“Sort by Freq”可根据不同的需要设定搭配词表的排列⽅式,如按频数排,按拼写字母排等等。
图1.5 提取搭配词表检索结果(4)提取搭配短语另外,也可以使⽤这⼀⼯
具来提取搭配词块,且可设置检索项在词块中的位置。
例:检索以ask开头的搭配词块a)点击主界⾯中的;
b)在“Search Term”⼀栏键⼊ask;c)设置检索项的位置,如选择“On theleft”;
d)设置搭配词块的长度,如Min.Size:3, Max.Size:3;e)点击,开始检索,检索结
图1.6提取搭配短语检索结果果如图1.6所⽰,所有的ask 被列在词块的左边。(5)隐藏、分类和删除
“隐藏”是指把检索结果中的检索项挖空,可⽤于教学或测试。具体操作⽅法如下:a)在“Search Term”⼀栏键⼊要检索的词项,如look;
b)点击,选择“Concordance”,再选择“Hide search term in KWIC display”,最后点击;c)点击,开始检索。检索结果如下:
you always do your own homework? Do you ******* for help when you think it necessary? Do you help2. 提取词频表
2.1单字和N字语词频表
单字词频表是指⽬标语料库的单词表,且词频表的检索结果是以每个词的形式及其频数排列。⽅法如下:a)选择要⽣成单字词频的⽬标语料库;
b)进⼊界⾯,设置词频表排列排序⽅式,如“Sort by Freq”;也可以设置为按词头的或者词尾的拼写字母顺序排列。c)点击,开始检索,检索结果如图2.1所⽰。
图2.1 单字词频表检索结果
N字语词频表是指⽬标语料库的多字语频数表。例如,检索句⼦“This is a pen”的2字语词频表结果为:“this is”、“is a”、“apen”。N字语词频表的提取⽅法如下:a)选择要⽣成单字词频的⽬标语料库;b)进⼊界⾯,后点击;c)设置N字语词频表的长度,如
d)选择词表的排序⽅式,如“Sort by Freq”;e)点击,开始检索,检索结果如图2.2所⽰。
图2.2 N字语词频表检索结果
2.2词项重组---词簇化(lemmatizing)
词簇化是将同⼀词性的某个词的所有曲折变化形式作削尾处理,并归为⼀个词簇来计算频数。其好处是可以简约词频表并且引起对构词法的关注。对词频表进⾏词簇化的⽅法如下:
在界⾯⽣成词频表之后,拉下Tool Preference菜单,选择Lemma list options, 点击open 和load,上传lemma1⽂档(可在本⽹站下载)点击Apply (如图2. 3所⽰)。词簇化的部分结果见图2.4.
图2. 3 设置词簇化界⾯
图2.4 词频表被词簇化后的结果(部分)。
图中1142例a和133例an被归为同⼀个词簇a共1275例。3. 提取关键词表
关键词表是指两个语料库的词频表相⽐,其中⼀个明显地⾼频于另⼀个的那部分词项表。前⼀个称⽬标语料库;后⼀个称参照语语料库,通常规模要⼤⼀些,以此来凸现⽬标语料库的⼀些特别⾼频词以浮现该语料库的主题或内容特⾊。3.1凸显⽬标语料库中显著性⾼频于对照语料库的词项具体操作⽅法如下:
a)点击file下拉菜单中的“open files”,选择要对⽐的⽬标语料的语料(如果对⽐整个⽂件夹,可以选择open directory);b)点击主界⾯中的;
c)点击,选择“Keyword List”,如图3.1所⽰;
d)选择“Show negative keywords”,可在检索结果中显⽰对照语料明显⾼于⽬标语料的词;
e)点击,选择对照语料,最后点击;
图3.1 Tool Preferences对话框f)点击,开始检索,检索结果如图3.2所⽰。
图3.2 提取关键词表检索结果