新書推薦:

《
2025中国企业跨境并购年度报告
》
售價:HK$
1760

《
中国折纸动画
》
售價:HK$
347

《
如何了解一个人
》
售價:HK$
352

《
木石交响:日本古都与欧陆遗产的千年对话
》
售價:HK$
407

《
中小学生数学学习能力自我评估问题研究
》
售價:HK$
408

《
蝉鸣震耳欲聋
》
售價:HK$
352

《
刘心武谈《三言》(冯梦龙文学经典“三言”原著的替代性通俗读本)
》
售價:HK$
347

《
边际利润
》
售價:HK$
352
|
編輯推薦: |
本书属于跨学科研究,模糊数学和古代汉语同义词的现有研究都比较成熟,以模糊数学的角度对词语义素分析结果进行量化表达,在研究方向和理路上较为新颖。这种对同义词相似程度进行量化和形式化描述的研究,或可对帮助计算机处理机器翻译和信息检索等的语言信息服务,有一定的推动作用。
|
內容簡介: |
从模糊数学的视角来看,语言中词语的同义关系属于模糊相似关系,具有自反性和对称性,因此可以此为前提,运用模糊聚类分析法来揭示一组同义词聚合的层次性。在本书前三章中,作者介绍了模糊聚类分析法的原理、目前古代汉语同义词研究的现状,以及将该分析法应用到同义词研究中的具体步骤;第四章中,作者基于王凤阳教授的著作《古辞辨》,择取其中三大类共十八组古代汉语同义词进行了模糊聚类分析。
|
關於作者: |
贾璐,女,2011年毕业于复旦大学中文系,获文学博士学位,2016年从北京师范大学中国语言文学博士后流动站出站,2022年—2023年任日本京都大学访问学者。现为广东外语外贸大学中国语言文化学院副教授,硕士生导师。近年来主持国家社会科学基金项目一项,主持国家语委中国语言资源保护工程汉语方言调查项目一项,主持省级哲学社会科学规划项目两项,均已结项。发表学术论文多篇,研究方向为汉语言文字学,训诂学。
|
目錄:
|
第一章 绪论
第一节 关于模糊聚类分析的算法
第二节 关于古代汉语的同义词
第二章 模糊理论概述
第一节 模糊集合的提出与函数表示
第二节 普通关系与模糊关系
第三章 模糊聚类分析法及其在同义词研究中的应用
第一节 同义关系的模糊性及其矩阵描述
一、词语的同义关系具有模糊性
二、模糊相似矩阵对词语同义关系的描述
第二节 同义词间相似系数的确定方法
一、相似性科学中关于系统要素相似度的计算
二、义素分析法是量化语言信息的桥梁
第三节 基于模糊等价矩阵的聚类分析
一、模糊传递闭包法的应用
二、模糊聚类分析的操作举例
第四章 基于《古辞辨》的古代汉语同义词的模糊聚类分析
第一节 《古辞辨》名物词的模糊聚类分析
一、隙 间 罅
二、涂 泥 墐 淖
三、纩 絮 缊
四、关 闭 扃
五、垣 墙 墉 埒
六、形 相 象 状
第二节 《古辞辨》运动词的模糊聚类分析
一、渍 润 浸
二、败 坏 毁
三、营 造 制 作
四、列 陈 罗
五、选 择 拣 抡
六、譬 比 况 方
第三节 《古辞辨》特征词的模糊聚类分析
一、美 好 丽
二、庄 矜 严 肃
三、黠 狡 猾
四、孤 独 单 特
五、温 暖 和
六、朴 素 质 淳
第五章 结语
参考文献
|
內容試閱:
|
第一章 绪 论
所谓聚类分析,就是用数学的方法对事物按一定的要求进行分类。在模糊数学产生之前,聚类分析已是数理统计多元分析的一个分支,有着广泛的实际应用。聚类的实质就是把具有相似性质的事物区分开来,传统的聚类分析是一种硬划分,即把每个待辨识的对象严格地划分到某类中,具有非此即彼的性质。然而在现实世界中,特别是在社会、经济、哲学、心理、教育等人文学科当中,大多数对象并没有严格的类属特性,它们在性态和类属方面存在着位于两个极点之间的中间状态,即具有亦此亦彼的性质,国外有人把这些学科称为“软科学”,因此更适合进行软划分。事实上,“这些学科之所以难于运用数学,不是因为它们太简单而没有资格运用数学,恰恰相反,是因为它们所面对的系统太复杂而找不到适当的数学工具。其中最关键的问题就是在这些系统中大量存在模糊性”。当模糊理论由美国系统控制论专家扎德(L.A.Zadeh)于1965年首次提出后,“模糊数学的一条重要的历史使命就是要为各门学科、尤其是人文学科提供新的数学描叙的语言和工具,使软科学研究定量化”。在这样的背景下,模糊聚类分析法也就应运而生了。
应用模糊数学的理论和方法,在模糊相似关系的基础上所进行的聚类分析,称为模糊聚类分析。模糊聚类分析的基本思想是:首先将所研究的n个样本各自分为一类,然后计算它们之间的相似程度或距离,并将最相似(或距离最短)的两类归为新的一类,如此反复进行,直到所有样本都归为一类为止。迄今为止,模糊聚类分析法已在诸多领域得到了广泛应用,比如模式识别、图像处理、信道均衡、天气预报、灾害预测、环境保护、食品分类、地质研究、石油与天然气勘探、工程设计、经济管理、医学诊断等等。
人文学科对模糊聚类分析法的应用较少,因为人文学科中的研究对象一般不是用数据信息来刻画的,这一点不同于自然学科,也成了我们选用数学方法来进行研究的障碍。一旦我们意识到这个问题,就可以想办法将研究对象具有模糊性的表征信息数量化,从而为传统的研究方法开辟新的道路。
模糊聚类分析法要求以模糊相似关系为前提,我们认为,语言中的同义词就符合条件,即从模糊数学的视角来看,词语之间的同义关系首先是一种模糊关系,其次它具有自反性和对称性,属于模糊相似关系,可以尝试使用模糊聚类分析法。本书以此为切入点,重点论述了对语言学当中的词汇现象使用模糊聚类分析法的可行性,以及使用这种新方法获得的不同
以往的新发现。
模糊聚类分析法原则上适用于语言中所有的同义词,本书选择古代汉语同义词作为研究对象,现代汉语同义词的模糊聚类分析是我们下一步的研究目标。对同义词进行模糊聚类分析,我们认为主要有以下几个方面的意义和价值。
首先,可以揭示出同义词聚合的层次性。以往对同义词的研究只停留在判断某词与某词是否具有同义关系上,通过对同义词进行模糊聚类分析,我们可以发现,处于同一个同义聚合体中的各个词语,它们相互之间的聚合并不在同一平面上,而是有着不同的层次。模糊聚类分析法不仅揭示出了这种聚合层级的存在,而且还可以确定出每一层的聚合水平值,使我们能够对词语的同义现象有更为深入的认识,这对汉语词汇研究本身是一个补充和突破。
其次,研究词语的聚合可以为词语的组合提供选择。组合关系的每个位置上可能会出现的词要到有关的聚合里去选择,一般而言,组合上的不同要从聚合上去找原因。在同义词这个聚合体中,并不是每个成员都能出现在不同组合关系的同一位置上,这是因为同义词之间存在着差异。通过对同义聚合体中的词语进行义素分析,我们可以清楚地看到这种差异并分
析造成这种差异的原因,进而满足不同组合的需要。
最后,可以用数值精确表示出同义词之间的相似程度,从而帮助计算机处理语言信息服务。在机器翻译和信息检索领域,同义词之间的差异规定着词语在翻译和检索中可以相互替换的程度:差异大的,词语可替换的程度就低;差异小的,词语可替换的程度就高。这种差异实际上反映了同义词之间的相似程度。我们对该相似程度进行了量化和形式化的描述,这样就可以把自然语言转化为机器能够识别的形式语言,从而实现计算机对同义词的信息处理。
……
涉及事物之间的模糊界限时按一定要求对事物进行分类的数学方法。聚类分析是数理统计中的一种多元分析方法,它是用数学方法定量地确定样本的亲疏关系,从而客观地划分类型。事物之间的界限,有些是确切的,有些则是模糊的。例人群中的面貌相像程度之间的界限是模糊的,天气阴、晴之间的界限也是模糊的。当聚类涉及事物之间的模糊界限时,需运用模糊聚类分析方法。模糊聚类分析广泛应用在气象预报、地质、农业、林业等方面。通常把被聚类的事物称为样本,将被聚类的一组事物称为样本集。模糊聚类分析有两种基本方法:系统聚类法和逐步聚类法。
数据分类中,常用的分类方法有多元统计中的系统聚类法、模糊聚类分析等.在模糊聚类分析中,首先模糊聚类分析矩阵要计算模糊相似矩阵,而不同的模糊相似矩阵会产生不同的分类结果;即使采用相同的模糊相似矩阵,不同的阈值也会产生不同的分类结果.”如何确定这些分类的有效性”便成为模糊聚类的要点。
识别研究中的一个重要问题.文献,把有效性不满意的原因归结于数据集几何结构的不理想.但笔者认为,不同的几何结构是对实际需要的反映,我们不能排除实际需要而追求所谓的”理想几何结构”,不理想的分类不应归因于数据集的几何结构.针对同一模糊相似矩阵,文献建立了确定模糊聚类有效性的方法.用固定的显著性水平,在不同分类的F一统计量和F检验临界值的差中选最大者,即为有效分类.但是,当显著性水平变化时,此方法的结果也会变化.文献引进了一种模糊划分嫡来评价模糊聚类的有效性,并人为规定当两类的嫡大于一数时,此两类可合并,通过逐次合并,最终得到有效分类.此方法人为干预较多,当这个规定数不同时,也会得到不同的结果.另外这两种方法也未比较不同模糊相似矩阵的分类结果。
|
|