高中作文网

地理信息概述(6篇)

时间: 2024-07-07 栏目:公文范文

地理信息概述篇1

关键词:计算机应用;中文信息处理;词语语义相似度;知网;“义原”;语义信息量

中图分类号:TP391文献标识码:A

1引言

语义相似度,在信息检索,信息抽取,词义排歧,机器翻译等都有很大的应用。词语的语义相似度的计算,主要有两类计算方法:一类是通过树型的义类词典来获得;一类是通过词语上下文的统计背景信息获得。在一颗或几颗树上计算节点的相似度的方法研究相对比较成熟,比如Resnik's[1]、DekangLinE[2]都给出了比较合理的计算理论和公式。

但中文词语的相似度计算并不能直接借用国外研究人员在wordnet中的方法。原因在于知网并没有像wordnet一样将所有的词组织在一个分类的层次体系中(树状结构中),而是精心选取了一个“语义单位”――“义原”的集合,然后用这个集合中的元素来描述中文词语/概念。“义原”被组织在几颗层次树中,可以借用在wordnet的分类体系中计算词语相似度的思想。如何通过“义原”的相似度来得到词语/概念的相似度,成为利用知网计算中文词语相似度的关键所在。我们在这篇论文里提出“义原”本身所含信息量具有大小之分,而它所含有的语义信息量决定着它对概念的描述作用(区分此概念和其他概念)。另外,在“义原”对概念的描述方式上,我们也提出了自己的观点:认为描述/定义一个概念的“义原”分为直接描述和间接描述两个部分。

接下来的第2部分,我们将首先从两个角度来简要地介绍《知网》;第3部分给出《知网》中词语相似度的计算归结为“概念”相似度的计算;第4部分讨论“概念”的相似度如何由描述它的“义原”的相似度得到;第5部分给出我们计算“义原”之间相似度所采用的公式。第6部分为我们的实验结果和分析。最后第7部分是我们的结论。

2《知网》2000介绍

《知网》][3]是我国著名机器翻译专家董振东先生逾十年功夫创建的一个知识系统。它含有丰富的词汇语义知识和世界知识,内部结构复杂。我们主要从语义词典和世界知识库两个角度对《知网》进行理解分析。

2.1《知网》是一部语义词典

《知网》的基本形式是对中文词语的释义和描述。与一般的语义词典如Wordnet不同的地方有两点:

第一,词语(概念)的意义不是通过一些其他的常用词语来解释、说明,而是通过“义原”来描述、定义。比如“打”(打篮球,打太极),这个词有一项描述是:

DEF=exercise|锻炼,sport|体育

“锻炼”和“体育”就是两个义原。《知网》作者总共定义了1600多个这样的义原一汉语中“最基本的、不易于再分割的意义的最小单位”,然后用它们来对3万多个中文词语进行解释描述。义原的具体分类如下(数字标号为义原个数):

aEvent|事件813

bentity|实体142

cattribute|属性/aValue|属性值433

dquantity|数量/qValue|数量值13

eSecondaryFeature|次要特征100

fsyntax|语法41

gEventRole&Features|动态角色和属性74

《知网》作者认为义原是比词语更小一级的语义单位,但我们更倾向于这样的理解:这1600多个义原是中文语言的一个核心词语集合,和词语是同一级的语义层次。《知网》用这个核心集合构成的语义内涵(语义特征)去描述所有中文词语。因此,我们认为义原分类隐含着如下的语法结构:“实体”义原,描述万物,名词的核心集合;“事件”义原,描述动作,动词的核心集合;“属性”/“属性值”义原和“数量”/“数量值”义原,描述属性(属性程度),形容词副词的核心集合;“语法”义原,对应助词、代词、介词等不含有直接语义信息或含较少语义信息的词类。“次要特征”义原,专门规定,用来描述事物类概念(名词类)的次要特征。“动态角色和属性”义原,专门规定,描述事件类概念(动词类)的内容和特征。

第二,词语不是组织在一个树状的层次体系中,而是存在一种网状关系[4]。

首先,用来描述词语的义原之间存在多种关系。我们认为在《知网》2000中,义原之间的主要关系有:上下位关系;属性关系,指“实体”类义原(置于口中,见图1)和“事件类义原”的共性(置于{}中);对义关系和反义关系。其中最基本的仍然是树状层次体系中的上下位关系(见图1)

其次,借助一些标识符号对概念进行描述,这些标识符体现了各种关系。(见表1)

从表1的例子中可以看出,《知网》义原加标识符来定义词语的方式不但给出了词语的语义信息,比如“医院”是医疗场所,也显式地给出了概念之间的联系,比如“医治”的实施者是“医生”,受事者是“患者”,而地点是“医院”。又比如:“布”是“衣物’’的原材料,而“T恤”的定义是:DEF=clothing|衣物,#body|身。我们就可以推理出“T恤”的原料是“布”。这种联系正是《知网》作者所要反映的“世界知识”。

2.2《知网》是一个世界知识库(aknowledgebasesystem)

何谓“世界知识库”?我们引用Ontology的定义来说明,“与词典和分类表类似,但包含有更详细的信息,最重要的是其组织方式能够让计算机处理和识别”。比如上文提到的“推理出‘T恤’的原料是‘布’”,《知网》借助于符号标识,让计算机具备了这个层次上的逻辑推理知识能力。《知网》的作者一再强调《知网》是“以揭示概念与概念之间以及概念所具有的属性之间的关系为基本内容的常识知识库”,但本文更多的将《知网》2000放在语义词典的层次上使用,故不对此作深入的讨论。

3词语语义相似度的计算

什么是词语语义相似度?DekangLin[2]认为任何两个事物的相似度取决于他们的共性(Common-ality)和个性(Differentces),然后从信息理论的角度给出任意两个事物相似度的通用公式:

其中分子是描述A,B共性所需要的信息量的大小;分母是完整的描述出A,B所需要的信息量大小。

刘群、李素建[4]认为两个词语的相似度是它们在不同的上下文中可以互相替换且不改变文本的句法语义结构的可能性大小。在下文中(第4部分和第5部分)我们分别借鉴了前者的事物信息量的概念;后者的整体相似度由部分相似度合成的思想。

词语存在着一词多义的现象,知网中的一词多义表现为单个词语有多个概念,每个概念由一项定义来描述。比如:“打”在“打架”,“打太极”,“打猎”中的意义各不相同,知网中对应的概念描述分别是:

DEF=fight|争斗

DEF=exercise|锻炼,sport|体育

DEF=catch|捉住,#animal|兽

词语语义相似度的计算,严格来讲,应该是计算概念之间的语义相似度。本文中采用刘群[4]的思路,认为两个孤立词语(不处在一定的上下文背景中)的语义相似度是其所有概念之间相似度的最大值。

Sim(W1,W2)=maxSim(C1i,C2j)

i=1…n,j=1…m

(1)

其中,C1i是词W1,的n项概念(词义),C2j是W2的m项概念。

4概念相似度的计算

我们先假定得到了任意两个义原之间的相似度(第5部分介绍),现在讨论如何利用义原之问的相似度合成两个概念的相似度。假定描述两个概念的义原集合是:

C1={S11,S12,…,S1n},C2={S21,S22,…,S2m}

问题即为如何由集合中元素的相似度得到整体的相似度。一种比较直观的方法是先寻找最优匹配,集合中彼此最相似的元素两两组合,然后加权取均值就是整体的相似度。每组义原之间的相似度在整体相似度中的权值大小,我们遵循以下两个观点:

一、每个义原在定义概念中的作用大小不同。一个义原所携带的语义信息越丰富,对概念的描述就越具决定性作用(即越能区分此概念同其他概念),相应的其在概念相似度计算中的比重就越大。怎样判定一个义原携带的语义信息丰富与否?我们认为一个义原所代表的语义内涵越具体,其语义信息就越丰富。反映在义原层次树上,层次越深/越靠近叶子的节点,该义原语义信息越丰富。由此得到计算公式(假定m≤n):

Pi是一组元素配对――最大匹配取得,φ表示和空元素对应,ωi是这组元素的相似度在整体相似度中的权值,di是两个义原在义原层次树中深度的较小值,根节点层次设为1。若义原和空元素对应,则Sirs(pi)取一较小的值γ(参数)。

二、我们认为在概念的定义中不带符号的义原是对概念的一种直接描述,表明一种isa的定义关系或者是识别该概念必不可少的特征(属性);带有符号标识的义原是对概念的一种间接描述,表明概念的一些其他属性。两者对概念的描述作用大小不同,应该分成两组集合分别计算,然后再加权求均值。同时,前者的权值应该更大。公式(2)变为:

Sim(C1,C2)

=β×Sim(C11,C21)+(1-β)×Sim(C12,C22)(3)

Ci1是Ci中不带符号义原的集合,Ci2是Ci中带符号义原的集合,β为调节参数。

此外,在概念的定义中,有时候会出现不用义原而直接使用其他词语来描述的情况――出现在一个括号内。比如,“佛教徒”:

DEF=human|人,religion|宗教,(Buddhism佛教)

“盟军”:

DEF=arm|军队,#country|国家,*ally|结盟,mili-

tary|军,desired|良,#(WWⅡ|二战)

我们统一规定此时词语和词语若相同,则相似度为1,否则相似度为0;词语和义原之间的相似度则统一取较小值η。词语的“层次深度”统一设为一个较小值h(参数)。

在实际的计算中,带符号的义原之间分组应该是带有相同符号的义原配对,如果仍旧使用最大匹配,相似度的计算成为一种相关度的计算。比如“医生”:

DEF=human|人,#occupation|职位,*cure|医治,

medical|医

“患者”:

DEF=human|人,*SufferFrom|罹患,$cure|医治

采用最大匹配:

{(human|人,human|人>,,

null>}(其中的null表示φ)

采用一一对应:

{,,,,}

前者的值比后者大,因为“医生”和“患者”十分相关,却不能说很相似。

5义原相似度的计算

义原相似度的计算依据义原的层次体系(上下位关系)来计算,这种基于树状层次结构计算语义相似度的研究已经十分成熟。Resnik's[1]、DekangLin[2]、刘群[4]等都提出了自己的公式,BUDAN-ITSKY[5]对基于Wordnet的几种计算方法进行了比较。我们认为他们的方法可以分为两大类:一种是基于两个节点之间的路径长度,一种是基于两个节点所含的共有信息大小。本文分别采用了两种公式来计算义原相似度:

a.刘群的公式:

其中,S1,S2表示两个义原,distance(S1,S2)表示它们的路径长度,a是一个调节参数,表示相似度为0.5时的路径长度。

同时,我们参考吴健,吴朝晖,李莹[6]的计算词汇相似度的思路,引入节点的层次深度:

这样在路径距离相同的情况,层次越深的节点具有越高的相似度。

b.Lin的公式:

其中,S1,S2表示两个义原,Sp表示离他们最近的共同祖先,p(S)是该节点的子节点个数(包括自己)与树中的所有节点个数的比。

由于《知网》定义的所有义原并不是在一棵树上,而是构成森林。我们统一规定,不在同一颗树上的两个义原之间的相似度取一较小值δ(参数)。

如果两个义原之间存在对义或者反义关系(通过查表得到),我们将它们的相似度减低为原来的n分之一(参数),比如“大”,“中”,“小”在“属性值”这颗义原树上是兄弟节点,按上述公式计算,它们的相似度都很高,但我们认为实际的语言经验中是不会把“大”和“小”作为相似的语义概念来对待的。

6实验结果与数据分析

6.1实验一

为了比较,我们选取刘群、李素建[4]论文中的一组实验词语(表3的上半部分)并加入几组典型词语(表3的下半部分)来说明两种方法的区别。实验中的参数设置见表2。

1.比较第4列和第5列。两者上半部分基本保持一致,无大的波动,下半部分有些数据变化较大,分为以下几类:

i.“珍宝”和“宝石”,“粉红”和“深红”。第4列它们相似度很低,而第5列相似度比较高。其原因在于第4列的计算方法倚重于第一个义原,比如“珍宝”、“宝石”的定义分别为:

DEF=treasure|珍宝,generic|统称

DEF=stone|土石,treasure|珍宝

第一义原为“珍宝”和“土石”,不具有很高的相似度。按刘群、李素建的方法,它们整体相似度不会很高。而我们的方法是将所有不带符号(独立义原)放在一起计算,并赋予适当的权值。这样“珍宝”和“珍宝”对应,“统称”和“土石”对应,且前一对的权重较大,因此得到整体较高的相似度。

ii.“美丽”和“丑陋”。第4列相似度较高,第5列较低。因为我们认为具有对义和反义关系的义原即便在义原树上相隔很近(这里是“美”和“丑”),也不能认为它们具有很高的相似度。类似的义原有“大”和“小”、“冷”和“热”等。

iii.“中国”和“美国”。第4列给出的相似度十分高,我们的相似度0.6多一些。《知网》中,“中国”和“美国”的定义分别为:

DEF=aValue|属性值,attachment|归属,#country|国

家,ProperName|专,(US|美国)

DEF=aValue|属性值,attachment|归属,#country|国

家,ProperName|专,(Asia|亚洲)

据定义似乎应该具有十分高的相似度,它们的区别只有最后一项词语(具体词)描述,这部分相似度为0。(前文中规定:出现在知网描述中的两个词语若相同,则相似度为1;不同,则取0)。在我们的计算中,具体词对整体的相似度影响较大,“层次深度”设为5。因为我们认为知网描述中出现的具体词包含有较丰富、具体的语义信息,对其所描述词的性质具有直接的决定和影响。

2.比较第5列和第6列。后者的上半部分数据略微有些整体上移,下半部分数据中有两对词语相似度明显改善,“跑”和“跳”,“发明”和“创造”。考察它们的主要定义,都是由单一义原组成:

DEF=run|跑DEF=jump|跳

DEF=produce|制造DEF=create|创造

由于只有单一的义原描述,相似度完全等同于义原之间的相似度。我们认为具有单独描述能力的义原是包含较多语义信息的义原,应该提高它们的相似度,而公式(5)恰恰提高了具有深层次的节点(包含较多语义信息的节点)之间的相似度。

3.比较第6列和第7列,两者基本一致。但对于义原树中两个叶子节点而言,公式(6)会给出更高的相似度,比如“男人”和“女人”中的“男”和“女”,公式(5)是计算得到的相似度为0.545,公式(6)计算的相似度为0.819。我们认为前者更合理一些。因为用1600多个义原来描述所有的中文词语,从语义分布上而言,它们之间应该具有一定的间隔。公式(6)更加适合Wordnet这种由大量词语构成的树状体系,节点与节点之间信息相对细微紧密。

4.虽然我们得到的结果总体来说和人的直观相似,但有些结果显然与实际经验不符。比如按照“男人”和“女人”、“男人”和“和尚”的相似度,我们可以认为“女人”和“和尚”也十分相似。又比如“青山”和“苍山”的相似度只有0.467,“香蕉”和“苹果”的相似度为1(它们的定义都是“fruit|水果”)。这种结果一方面是因为知网的描述在有些地方有待加强修改,进一步的深入细致;另一方面我们对知网的理解也有待进一步的深化。

6.2实验二

为了更加直观的观察我们方法的效果,我们特别计算了《同义词词林》[7]中同义词语对的相似度。《同义词词林》将汉语的常用词按词义的远近和相关性分成若干词群,每个词群被编排在同一行,我们选择表示同义词群(即去掉相关词群和独立词群)的行。每行选择前两个词进行计算,得到统计结果如下(表4):

1.“Hownet中可计算的词对”是指在《知网》中可查询的词语。有相当一部分《同义词词林》中的词语在《知网》中没有被收录,说明二者的编撰的确存在较大较别。而在可计算的词对中相似度为1(即《知网》释义完全相同的词组)占63.71%,又说明两者对词语的解释基本保持符合一致。

2.从表中我们可以看到相似度计算在0.7~1之间的词对占了相当一部分,说明我们的方法比较有效。但我们也看到在0.4~0.7之间的词对也有不少,我们认为除了《知网》本身有待进一步完善和补充外,通过义原的相似度(相对稀疏的层次结构)来反映大量词语之间的相似度(相对密集)的方法本身是否存在一定的上限是一个需要进一步深入研究的地方。

7实验结论

《知网》含有丰富的语义信息和世界知识,理解其构建的哲学思想和义原体系,充分利用其特定的描述方式是使用《知网》的关键。

本文在参考刘群、李素建[4]的基础上,提出了自己的观点:首先认为义原携带的语义信息有大小之分,越是处于底层的节点语义信息越丰富;其次认为义原对概念定义作用的大小正是取决于其本身所携带的语义信息;最后,我们将义原对概念的描述分为直接描述和间接描述,并认为直接描述是区分概念必不可少的语义信息,间接描述是区分概念的补充信息和世界知识。根据这三个基本观点,我们得到了自己的计算公式。最后在实验中和刘群、李素建[4]的结果作了比较,并详细分析了两者差别的地方;同时通过计算《同义词词林》中若干同词义的相似度验证了我们的方法。

在下一步的工作中,我们将改用《知网》2005的免费版来进行研究,进一步探讨研究知网义原构建体系的特殊性以及如何利用这种特殊性得到更加合理的计算方法。

收稿日期:2006-06-03定稿日期:2006-12-13

作者简介:李峰(1983-),男,硕士,主要研究方向为自然语言处理。

参考文献:

[1]EnekoAgirre,GermanRigau.AProposalforWordSenseDisambiguationusingConceptualDistance[A].In:ProceedingsoftheFirstInternationalConferenceonRecentAdvancedinNLP[C].1995.

[2]DekangLin.AnInformation-TheoreticDefinitionofSimilaritySemanticdistanceinWordNet[A].In:ProceedingsoftheFifteenthInternationalConferenceonMachineLearning[C].1998.

[3]HowNet[R].HowNet'sHomePage.keenage.tom.

[4]刘群,李素建.基于《知网》的词汇语义相似度的计算[A].第三届汉语词汇语义学研讨会[c],台北,2002.

[5]BUDANITSKY,A.ANDHIRST,G.Semanticdi-tanceinWordNet:Anexperimental,application-orien-tedevaluationoffivemeasures[A].In:WorkshoponWordNetandOtherLexicalResources,Secondmeet-ingoftheNorthAmericanChapteroftheAssociationforComputationalLinguistics[C].2001.

地理信息概述篇2

关键词:本体技术;知识划分;数字图书馆;分类法

中图分类号:G250文献标识码:B

文章编号:1004-373X(2008)24-109-04

ApplicationofOntologyTechnologiesinDigitalLibrary

QIUBaoyan,LVXianghui,QIAOHong

(SchoolofManagementandEconomics,ShandongNormalUniversity,Ji′nan,250014,China)

Abstract:Recently,researchontheapplicationofontologytechnologiesisquiteapopularresearchdirection,thisarticlediscussestherelevanceconceptofontologyandDigitallibrary,thepartition,classificationofknowledgesegmentsaredevelopedinthelightofontology,anddiscussestheimportantapplicationofontologyindigitallibraryanditsfunctionindetailthroughclassification,torevealtheimportanceofontologyindigitallibrary,therebyitisbeneficialtousersmakinguseofthelibraryresourceconvenientlyandrapidly,itimprovestheknowledgeinnovationandapplication.

Keywords:ontologytechnology;knowledgepartition;digitallibrary;classification

1引言

目前社会各领域信息的飞速膨胀阻碍了各领域用户对信息的查找、访问及维护,面对信息资源日新月异的增长,如何有效组织复杂的海量信息,提供高效便捷的信息服务,成为数字图书馆界迫切需要解决的难题。本体自20世纪90年代初提出以来,在知识表达、智能推理、信息共享、知识工程及其相关的领域得到了广泛的应用。本体技术依赖其对于概念体系在语义和知识层次上的有效组织,在数字图书馆中得到了广泛的应用,提供了公共的理解问题的基础。

2关于本体

本体最早是哲学上的一个概念,近年来被引入人工智能和其他计算机科学领域,如数据库设计、电子商务和知识管理等。最早的本体定义是1991年Neches等提出的:“给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延的规则的定义”。

1993年,Grube将本体定义为概念模型的明确的规范说明。后来,Studer在进行了深入研究后,将其定义为“共享概念模型的明确的形式化规范说明”[1],其中概念模型,是指通过抽象出客观世界中一些现象的相关概念而得到的模型;明确,是指所使用的概念及概念的约束都是有明确定义的;形式化,是指本体能被计算机处理;共享,是指本体中体现的是共同认可的知识,反映的是相关领域公认的概念集。本体的目标是捕获相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇(术语)和词汇间相互关系的明确说明。

虽然不同研究者对本体有不同的描述,但是从内涵上来看,他们的认识是一致的,都把本体当作某个领域内不同主体(人、、机器等)之间进行交流(对话、互操作、共享等)的语义基础。其实,本体就是通过对于概念、术语及其相互关系的规范化描述,勾画出某一领域的基本知识和描述语言,是一个已经得到公认的形式化的知识表示体系,包含词表(或名称表/术语表),词表中的术语全是与某一专业领域相关的,而逻辑声明全部用来描述术语的含义及关系[2]。

2.1本体的作用

(1)本体为人和主体之间的沟通和交流提供了共享的基础,也方便了不同领域的系统开发人员和研究人员之间的沟通,它是人机在语义上交互的最好的基础。

(2)本体支持对于知识的重用。本体提供了独立于应用的描述方法使之可在不同系统间重用。例如在基于构件的软件开发过程中,开发知识系统时知识工程师可以将本体论概念引入知识工程,详细说明模型中的概念、实例、关系和公理等实体,并以此建立领域本体。然后针对属性提出本体建模概念化分析的形式化方法,解决知识共享中的问题。此举有效地提高了工作效率,促进了来自不同领域的研究人员和组织间的交流。

(3)本体提供了一种结构化的表示领域知识的形式化方法。在本体中,明确说明了领域概念及概念之间的关系,并且支持对领域规则的描述,是领域知识的形式化表示。

(4)知识本体可以明确领域假设,使领域公理得到明确描述从而达成共知。

2.2本体的分类

2.2.1按照领域依赖程度分类

(1)顶层(top-level)本体:其描述最普通的概念及概念之间的关系,如空间、时间、事件、行为等,完全独立于特定的问题和领域,其他本体都是该类本体的特例。

(2)领域(domain)本体:描述的是特定领域(医学、地理等)中的概念及概念之间的关系。

(3)任务(task)本体:描述的是特定任务或行为中的概念及概念之间的关系。

(4)应用(application)本体:描述的是依赖于特定领域和任务的概念及概念之间的关系。

在这个分类当中,领域本体和任务本体处于同一个研发层次,它们都能应用顶层本体中定义的词汇来描述自己的词汇。应用本体既能应用领域本体中的概念,也能引用任务本体中的词汇。

2.2.2按照细化程度分类

Guarino从2种不同的维度对本体进行划分。除了依据对领域的依赖程度分类,还提出了以详细程度分类。详细程度是相对的、模糊的一个概念,是描述或刻画建模对象的程度。参考(reference)本体:详细程度高;共享(shareable)本体:详细程度低。

2.2.3按照形式化程度分类

(1)高度非形式化:用自然语言松散表示;

(2)结构非形式化:用限制的结构化的自然语言表示;

(3)半形式化:用半形式化(人工定义的)语言表示;

(4)严格形式化:所有术语都具有形式化的语义,能在某种程度上证明完全性和合理性。

2.2.4按照是否具备推理功能分类

(1)轻量级本体(LightweightOntology):轻量级本体不具备逻辑推理功能,例如叙词表和WordNet。

(2)中级本体(MiddleOntology):中级本体逻辑推理功能简单,系统可以识别一阶谓词逻辑的表达式。

(3)重量级本体(HeavyweightOntology):重量级本体具有复杂的逻辑推理功能,系统可以识别更加复杂的二阶谓词逻辑的表达式,并为更加复杂的推理功能的实现预留了接口,如Cyc本体系统。

除了上述几种分类方法外,1999年,Perez和Benjamins在分析和研究了各种本体分类法的基础上,归纳出10种本体:知识表示本体、常识本体、顶级本体、元(核心)本体、领域本体、语一言本体、任务本体、领域一任务本体、方法本体和应用本体。这种分类法是对Guarino提出的分类方法的扩充和细化,但是这10种本体之间存在交叉,层次不够清晰。

2.3本体构建原则

(1)清晰性:本体应该用自然语言对所定义术语给出明确的、客观的语义定义;

(2)完全性:所给出的定义是完整的,完全能表达所描述术语的含义;

(3)一致性:由术语得出的推论与术语本身的含义是相容的,不会产生矛盾;

(4)可扩展性:即向本体群中添加通用或专用的术语时,不需要修改其已有的内容;

(5)本体约束最小:对待建模对象给出的约束应该尽可能少,只要能够满足特定的知识共享需求即可;

(6)编码偏好程度最小:概念的描述不应该依赖于某一种特殊的符号层的表示方法[3]。

2.4本体构建方法论

MikeUshold&MichealGruninger的骨架法(SkeletalMethodology)在企业本体基础之上,是相关商业企业间术语和定义的集合,该方法只提供本体开发的指导方针。该框架包括以下组成部分:

2.4.1框架组成部分

(1)确定本体的目的和使用范围;

(2)构造本体。具体包括3步:本体捕获:即确定关键的概念和关系,给出精确定义,并确定其他相关的术语;本体编码:选择合适的表示语言表达概念和术语;已有本体的集成:对已有本体的重用和修改;

(3)评估:根据需求描述、能力问题等对本体以及软件环境、相关文档进行评价;

(4)文档记录。M.Gruninger&M.S.Fox在进行TOVE本体的研究和开发时,总结了设计和评估本体的方法学,包括背景和需求描述、非形式化的能力问题描述、词汇和术语确定、形式化的能力问题描述、用一阶谓词逻辑进行规范描述、调整解决方案,使本体趋于完备。

2.4.2领域本体构建方法

NatalyaF.Noy和DeborahL.McGuinness提出了被称为“七步法”的领域本体构建方法。即:

(1)确定本体的专业领域和范畴;

(2)复用现有的本体;

(3)列出本体中的重要术语;

(4)定义类和类的等级体系;

(5)定义类的属性;

(6)定义属性的分面;

(7)创建实例。

以上几种方法各有自己的优势和不足,虽然都允许系统之间的互操作,并可进行知识的共享与重用,但与IEEE标准相比,还没有一种方法体系是完全成熟的。

3数字图书馆

数字图书馆是社会信息基础结构中信息资源管理、存储和传输的基本组织形式,拥有丰富的超容量多媒体介质的数字化信息资源,依托网络为信息需求者提供快捷高效的数字化信息服务[4]。发展基于知识的数字图书馆的必要性在于:

(1)数字图书馆资源的知识化组织,不仅是一些简单元数据的表示,也是对所反映内容的有效组织,这需要建立广泛的基础性和领域性本体,并能不断学习与进化。

(2)不同的人对知识的理解与应用不同,网络怎样认知人的知识需求,并在合适的时间给人合适的知识,这是基于知识的数字图书馆的发展目标[5]。但各类信息常在具体系统条件限制下用专门语言定义组织为内部结构和格式,难以有效进行机器支持的检索、解析、处理和交换,更不要说进行跨文献单元、数据类型、数据层次和系统范围的信息挖掘、抽取、综合分析描述、转换了。

目前,国内学术界对数字图书馆知识管理的研究尚未全面展开,现有的研究成果多限于内部信息资源知识化的管理,在实践应用研究方面,还缺乏系统的理论、成熟的模型以及完整的评估体系。而把本体应用于数字图书馆知识管理,极大地解决了语义知识缺乏的问题,并使其具有智能推理和自学习能力,为XML与RDF等技术提供语义支持。

另外,尽管在知识工程界主要把本体作为信息组织的工具,目前本体研究和实践也大多运用于人工智能中的知识表达,例如语义网络和框架,但由于本体开发的努力已经集中于基于形式逻辑和基于Web的知识表示中,这也使得本体在数字图书馆中能够得到广泛的应用[6]。

4本体在数字图书馆中的应用

4.1在数字图书馆信息资源整合中的应用

本体由于其在众多纷繁复杂的信息资源中具备明确、规范、可共享、包含语义信息等优势,快速、有效地整合各种信息资源,所以在数字图书馆中发挥重要作用,主要包括:

(1)灵活处理各类信息资源[7]。例如,可以方便添加各种类、属性,如填加联系方式类型等,并严格定义其与现有信息资源的关系;可以动态增加类的属性,并随时反应到系统中,然后通过在程序中调用本体,得到领域的最新知识,并动态地反映到应用系统中,而不用程序员修改程序。

(2)有效识别信息资源的类型。因为对每个概念(如name,time,place等)都有明确、客观的描述,所以调用本体可以识别哪些是描述内容的信息,如属性…_name,…_keyword,…_abstract,…_description等;识别哪些是描述时间的信息,如属性…_time,…_date,…_year等;识别哪些是描述地点的信息,如属性…_address,…_place,…_country等。

(3)信息资源的内容对应用程序透明。基于本体的系统在应用程序部分将和领域无关,因为领域知识全部存放在本体中,这样,对系统来说,领域中的各种信息资源在外在形式上是存在很多共性的,只是具体内容不同,就更容易将其整合到一起进行处理。

(4)提供资源库领域知识的规范描述。

(5)提供元数据映射方案,集成到数字图书馆体系中的元数据服务中,成为协议的一部分。

(6)提供智能与信息环境之间基于语义的理解机制。

(7)作为跨平台、跨系统之间的通信中介。

4.2在数字图书馆知识地图中的应用

知识地图这个概念最早由布鲁克斯(B.C.Brooks)提出,它是知识管理的有效方式和手段,用来描述组织流程中的知识,以图表的方式将业务流程中的知识流展现出来,包括知识的收集、存储和共享。知识地图是可以帮助人们明确在哪里能够找到知识的工具,利用知识地图将流程中的关键知识整合进来,可以达到提高工作效率的作用。

知识地图在数字图书馆知识管理系统中可发挥如下作用:知识的分类、存储、表示、导航以及隐性知识显性化等。而在系统中,知识的分类、导航可充分利用本体的复杂结构进行合理、细致的分类及准确、快速的导航定位。原因在于:

首先,本体的基础概念模型本身就是一张很好的知识地图。因此,构建领域本体的过程也绘制出了领域的知识地图。而且,本体构建结果中的各种类的层次图可以作为领域知识地图的一部分。例如人员类及其子类,就很好地展示了数字图书馆相关人员的情况,即有关数字图书馆人员的知识。

其次各种本体工具中的图形自动生成功能可用于知识地图的显示。在基于本体的知识管理系统中,可根据需要,动态生成各种知识地图。

比如,中国学术期刊网目前提供了以图形方式显示所输入检索词的相似词。用户可以根据这幅图更准确地了解检索词,因此这幅图对用户明确检索需求、修改检索条件等无疑会起到很大作用。遗憾的是,目前中国学术期刊只能提供星状的幅射图形,不能提供更加复杂、细致的结构图。可是,如果系统是基于本体的,就完全可以提供反映领域常识的、有层次、结构复杂的图形。

4.3在知识服务中的应用

知识服务,即以信息知识的搜寻、组织、分析的知识和能力为基础,根据用户的问题和环境,融入用户解决问题的过程之中,提供能有效支持知识应用和知识创新的服务。

目前,数字图书馆知识服务需要一个新型的技术基础,支持数据挖掘、知识发现、知识析取、知识应用和智能化服务(智能Web服务)[8]。无疑,本体技术仰仗其丰富的语义和广泛的关系,是实现以上目标的最佳手段,将本体建设和相应的引擎设计相结合即可解决问题。

用DAML-S在服务模型基础上定义流程模型本体,综合人工智能规划和工作流程研究成果,定义Web服务中的流程类型和流程控制等信息,可以较好地表示Web服务自动集成中的流程分类、合成、控制和时间约束等细节。

5结语

数字图书馆的出现,将是图书馆发展史上的一个里程碑,它帮助人们最快地获取所需要的知识,并为思路的展开创造了更多的机会。而本体的应用可以改善目前数字图书馆的一些不足,使之朝着基于知识的方向发展,最终能够提供知识服务。另外,除了上述文中提到的应用以外,本体还可通过语义对网页与文字进行提取与标引[9-11],通过聚类对信息资源进行主题分类、站点导航等,这些无疑都更加丰富了数字图书馆的应用。

参考文献

[1]StuderR,BenjaminsVR,FenselD.KnowledgeEngineering:PrinciplesandMethods[J].DataandKnowledgeEngineering,1998(25):161-197.

[2]UscholdM,GruningerM.Ontologies:Principles,MethodsandApplications[J].TheKnowledgeEngineeringReview,1996,11(2):93-155.

[3]GruberT.TowardsPrinciplesfortheDesignofOntologiesUsedforKnowledgeSharing[J].InternationalJournalofHuman-computerStudies,1995,43(5/6):907-928.

[4]邓凯,吴家春,王洪伟.本体论在知识图书馆中的应用初探[J].情报科学,2003,21(1):106-109.

[5]刘佳.Ontology在基于知识的数字图书馆中的应用[J].情报资料工作,2006(3):55-59.

[6]陈文彬.Ontology在图书服务网络中的应用[J].现代图书情报技术,2003(6):8-12.

[7]张哲.利用本体和主题词表的集成查询元数据[J].情报杂志,2004,23(4):16-18.

[8]楼向英.Ontology:概念及其在数字图书馆中的应用[J].图书馆杂志,2002(11):45-47.

[9]刘娇蛟,龚丽,李建华.基于本体实现对网页文本的自动主题分类[J].计算机工程,2003,29(11):95-97.

[10]贺娇.基于术语本体的网页标引方法[J].情报杂志,2004(3):28-29.

[11]王泰森.一个基于本体论全文自动标引方案[J].情报科学,2003(9):950-952.

作者简介仇宝艳女,1983年出生,山东济南人,工学硕士。研究方向为本体与知识管理。

地理信息概述篇3

关键词:语义WEB;WEB服务;匹配系统;描述逻辑

中图分类号:TP311文献标识码:A文章编号:1009-3044(2009)27-7745-03

DesignandImplementationofSemanticWebServiceMatchingSystem

ZHANGCai-neng,LUWu-kui,LIFa-ying

(ComputerDepartmentofXiangnanuniversity,Chenzhou423000,China)

Abstract:ThesemanticWebistheW3C’svisionofthenextgenerationWeb.ThispaperdiscussesthedesignandimplementationofanOntologyanddescriptionServicematchingSystemandanalysesandadvantagesofthissystemflexibilityofqueryandlogicallyreasoning.

Keywords:semanticWeb;WEBservice;matching-system;descriptionlogic

语义WEB的目标是使得WEB上的信息是机器可处理和可理解的。为了提高WEB上数据自动处理和智能化处理能力在语义WEB中引入了本体和描述逻辑等技术。

随着对本体研究的深入,本体已经被应用到了很多种应用系统中,如软件移动系统,知识管理系统等,不同的系统应用本体可以收到不同的效果,但总体说来,本体应用到这些系统中一个重要的因素就是将本体作为智能化知识推理的基础,对于本文的匹配系统而言,由于服务匹配系统最终用于公共信息查询系统中,所以引入本体的目的则是是为了探索基于语义WEB技术的信息处理系统的系统结构和实现方法。

描述逻辑作为知识表示的工具之一,由于它具有清晰的模型-语义理论,可以用它来清晰刻画语义,另外由于它与OWLDL在语义上的一一对应关系,使得我们在匹配系统中可以方便利用描述逻辑的研究成果,为匹配系统的应用研究奠定了良好基础。

1本体和描述逻辑

1.1本体

本体是概念的形式化的规范说明。引入本体概念的目的一是为了达成对某个领域内词汇的共同一致的理解;二是用于描述该领域内的知识,最终便于Web上数据的自动处理和智能化处理,便于Web服务的动态合成。在分布式计算环境下,,数据分布在整个Web中,通过使用本体来形式化表示知识并对分布式数据进行处理,从而提供明确的语义、属性和推理算法。

Web上的知识描述语言有W3C开发和推荐的RDF、RDFS和OWL,其中,OWL是W3C于2004年推出的一种知识表示和描述语言,在匹配系统中,通过在推理复杂度和知识描述能力之间折中,选用OWLDL作为本体语言。

1.2描述逻辑

在本文的服务匹配系统中采用描述逻辑主要基于以下两个原因:一是本体语言OWLDL与描述逻辑存在语义上存在一一对应关系,描述逻辑构造算子可以用于OWL语言描述的本体中;二是由于该匹配系统用于信息查询系统中,使得信息检索系统是基于语义和概念层次的,在概念层次的信息检索主要解决的关键技术是自然语言的处理技术。主要是从概念层次、知识层次来检索知识网络,语义和概念层次的检索系统的主要特点是具有很高的智能化程度。

2语义服务匹配系统SSMS的设计与实现

2.1系统功能

本系统为用户设计并实现了如下功能:

1)WEB服务的与获取。WEB服务由服务提供者通过UDDI规范到服务注册库中,并用WSDL语言描述服务,根据服务描述信息,服务需求者从服务注册库中获取需要的WEB服务。

2)WEB服务的维护。WEB服务的维护工作主要包括服务项目的添加、修改、删除以及注册新的WEB服务等功能。对于前3个功能,系统主要从本体着手,对本体库进行扩展,并在服务注册库中添加服务描述信息,以及在知识库中增加必要的知识概念。WEB服务的删除功能和注册新的WEB服务主要在服务注册模块中进行。

2.2WEB服务的查询与共享

服务匹配系统最终用于CIQS公共信息查询系统中,所以对WEB服务信息的查询和共享是系统设计时要着重考虑到信息查询的灵活性、高效性和信息的及时共享。

2.3系统的功能模块及实现

根据系统的需求分析,同时考虑本体的需要及语义Web技术的特点,在系统实现过程中,设计了多个功能模块,通过模块间的协同工作来支持信息的、维护和查询工作。其中的某些模块是由Jena工具包提供的。

在以前的基于本体的信息系统设计中,在数据库部分通常使用最基本的RDF本体语言来描述资源,通过一种固定的二元关系来定义概念、属性概念之间及属性之间的关系。如使用rdfs:Class来定义概念,用rdfs:Property来定义两个概念之间的关系,用rdfs:subClassOf及rdfs:subPropertyOf定义概念之间和关系之间的联系,通过rdfs:domain和rdfs:range来限制属性的定义域和值域。由于RDF和RDF对概念和关系只提供较少的限制,因而RDF不能成为表达力很强的本体语言。其次,基于本体和描述逻辑的WEB服务匹配系统需要本体语言本体具有很强的推理能力,由于在RDF文档中不允许定义多重概念之间的包含关系,这就决定了基于RDF本体语言的推理主要应用在WEB服务的获取,而不能应用在WEB服务的动态合成和智能化服务匹配。

为了满足表达WEB上信息的需求,同时控制推理复杂度,方便应用的开发,在实际的信息系统开发中采用W3C于2004年推荐的本体语言OWL,该本体语言是基于网络的本体语言,最适合用来开发在分布式计算环境下应用的WEB服务匹配系统和WEB服务发现系统。

2.4OWL文件的生成及本体编辑工具Protege3.2.1

在系统实现过程中,OWL文件即系统本体的生成可以通过专业的本体开发工具――Protege3.2来实现。该本体编辑器是一个优秀的编辑工具,它是美国斯坦福大学开发的开发源代码的免费软件,支持Racer推理机和FaCT推理,本体开发者在protege3.2上根据本体中使用的概念及其关系在对应的窗口界面中罗列概念名称和属性名称,并确定概念的包含和被包含关系,protege3.2中的OWL插件即可根据输入的原始概念生成对应的OWL文件,该OWL文件对应一般信息系统中数据库文件,不同的是,OWL文件本身包含有支持推理的足够的语义信息,图2是基于protege3.2的WEB服务注册界面。

2.5OWL本体中知识的获取

该文提及的WEB服务匹配系统是基于描述逻辑的分布式环境下的信息获取和信息智能化匹配系统,最终目的是应用在公共信息查系统CIQS中,为了提高信息查询效率,需要提高本体中知识获取的效率,该效率直接由本体的复杂度和本体组织的优化程度决定。在服务匹配系统中,从现成的知识库中获取隐含知识的能力完全由推理机的推理能力决定。本文主要通过以下渠道来提高知识推理效率,最后提高服务匹配效率和服务匹配智能化程度。

一是获取知识库中TBox中类的关系和属性的关系,也就是获取类的子类集,属性的子属性集,属性的特征,属性的定义域和值域。在OWL本体文件中,OWL都提供了相应的构造算子来表示类和属性的关系及它们的约束关系。

二是获取ABox中的信息,即获得一个类的所有实例、实例的属性、获得满足条件的所有实例,对ABox中信息的获取接近于实例的检索和信息的浏览,对推理的速度和效率要求较高。

2.6OWL本体文件

信息系统中使用最多的数据文件对整个信息系统的推理起着关键性的作用。本体的各部分组成都包含了OWL语法上的构造算子,而且所有的构造算子都有特定的含义,下面是声明与人相关的OWL本体中一小部分的基本组成。

//声明三个类,People,Man,Woman,并声明Man是People的子类,两者不具有相交关系。

//声明Woman是People的子类,两者不具有相交关系。

1

//声明Parent类是People的子类并指定它的数据类型属性的取值范围是非负整数最小基数值为1。

//类声明的结束标签

2.7系统的技术特色

基于本体和描述逻辑的服务匹配系统可以实现良好的推理功能,这是匹配系统应用于公共信息查询系统的前提和基础。推理可以实现智能服务匹配,从而实现信息的智能化检索,提高信息检索效率。该系统主要有以下几个优点:

1)系统具有良好的可扩展性。由于系统在分布式环境下进行服务匹配所需数据都包含在OWL本体中,在需要对系统增加功能时只需要增加本体层的词汇,只要增加的词汇不与领域本体中的概念相冲突;

2)整个系统具有异构分布的特点,适合在分布式计算环境下信息的获取和对信息的集成;

3)系统中的本体层、逻辑层和业务处理层可以相对独立地存在于系统中,可以实现一定程度的自治,可以优化系统性能,方便系统的维护;

4)系统的各个部分间可以互相协同,通过特定的接口实现知识层和其他各层的有机结合,从而实现基于描述逻辑的智能化推理;

5)系统为用户提供友好的智能检索界面和问题解答服务。这样就克服了基于关键字的信息检索2化程度低下的缺陷。

6)基于描述逻辑知识库可以接受类似数据库SQL语句的查询,为了提高推理机的效率,先对查询语句进行处理,然后再把处理后的查询语句提交给推理机,这样可以减少推理机的推理次数。

3结束语

该系统将语义WEB技术应用于信息处理领域,通过引入本体和描述逻辑,使得对语义WEB数据的智能化处理能力有了较大的提高。为了实现智能化查询的目标,还要加强对系统本体的维护,对知识库的更新,以及与其它系统和设备的应用接口都有待进一步研究。

参考文献:

[1]GruberT.ATranslationApproachtoPortableOntologySpecificationsKnowledge,Acquisition.1993.5(2):199.

[2]HayesP.RDFSemantics/TR/RDF-MT/.

[3]CARDOSOJ,SHETHP.Semantice-workflowcomposition[J].JournalofIntelligentInformationSystems,2003,21(3):191-255.

[4]CARDOSOJ,SHETHA,MILLERJ.QualityofserviceforworkflowsandWebserviceprocesses[J].JournalofWebSemantics,2004,24(3):25-32.

地理信息概述篇4

关键词:基本准则;概念框架;财务报告;会计制度

中图分类号:F235.99文献标志码:A文章编号:1673-291X(2009)26-0112-02

一、中韩两国财务会计概念框架差异比较

中韩两国概念框架都是借鉴国际IASB(国际会计准则理事会)概念框架制定出来的,因而从本质上看,中韩两国概念框架大同小异。但仔细研究发现,中韩两国概念框架在以下几个方面还存在着差异。

(一)在体例结构及表述方面的差异

中国2006年新的基本准则在称呼、体例安排和内容表述等方面,较大程度地保持了1993年首次的基本准则风格。由于中国的基本准则属于法规的范畴,其主要功能被定位在指导中国具体准则的制定上,因而从其表述的形式上看,更多地体现了法规式的概念框架特征,具有高度的概括性,并隐含着概念框架本身应该具有的内在一致性。

韩国概念框架不论从体例结构安排还是在表述方式上,都借鉴了IASB概念框架的风格,各部分内容的表述比较详尽,逻辑关系比较清晰。比如,在概念框架第一章指出了会计信息使用者及其对会计信息的需求;在第二章明确指出,其定位的会计目标是根据绝大多数会计信息使用者对会计信息的需求提出来的;在第三章又指出,概念框架对会计信息质量特征的设计及企业对它们的取舍应依据最大限度地达到财务报告的方向进行。

(二)在会计目标方面的差异

中国基本准则第一章提出了财务报告的目标。从本质上看,中韩两国对会计目标的表述大同小异,因为两国都认为财务报告应该同时提供对投资者决策有用的信息和反映受托责任履行情况的信息。但两国对会计目标定位的侧重点略有不同,韩国概念框架更强调提供对投资和信用决策有用的信息,相比之下,中国基本准则更强调提供以可靠性为特征的受托责任信息。比如,在对会计目标的表述上,基本准则将提供受托责任信息放在了第一位;在会计信息质量特征的表述中,基本准则将可靠性放在了第一位;在会计计量的表述中,基本准则指出:“企业在对会计要素计量时,一般应该采用历史成本。采用重置成本、可变现净值、现值、公允价值计量的,应当保证所确定的会计要素金额能够取得并能可靠计量。”而在会计计量属性的选择上,韩国概念框架第150条指出:“在不存在计量误差的条件下,依据公允价值或企业持有价值的计量将会比其他计量基础提供更有用的信息。”

(三)在会计信息质量特征方面的差异

中国基本准则的第二章描述了八条会计信息质量特征,主要包括可靠性、相关性、可理解性、可比性、实质重于形式、重要性、谨慎性和及时性。但并没有明确表述会计信息质量特征与会计信息之间的逻辑关系,没有将会计信息质量特征划分层次,也没有对会计信息质量特征彼此之间可能产生的矛盾做出必要的说明。在会计信息质量特征的表述形式上,基本准则表现出高度概括的法规式的概念框架特征。

韩国概念框架第三章描述了会计信息质量特征。与中国的基本准则相比,这些特征的安排具有以下特点:1.明确指出会计信息质量特征的表述与财务报告目标是相符的。2.区分了不同层次的会计信息质量特征,并将相关性和可靠性定位为会计信息的主要特征;将可靠性定位为次要特征。其中相关性排在首位,被分解为预测价值、反馈价值和及时性三个特征;可靠性排在第二位,被分解为如实反映(又被分解为实质重于形式和完整性两个特征)、可验证性和中立性。3.强调重要性和成本效益原则是影响会计信息质量的制约因素。4.没有明确提出谨慎性的会计信息质量特征。

应当说,韩国会计信息质量特征的这种安排,在总体上借鉴了美国FASB(财务会计准则委员会)概念框架的做法,它强调了美国会计信息质量所强调的相关性与可靠性,并指出当这两个首要特征出现矛盾时,应该以满足投资人决策的需要为主。从理论上讲,韩国会计信息质量特征的这种安排与其对会计目标的定位有着严密的逻辑关系。

尽管中韩对会计信息质量特征的表述方式和侧重点有所不同,但从主要特征的涵盖面上看,中韩两国财务概念框架还是具有较大共性的。

(四)在会计要素分类方面的差异

关于会计要素的分类,中韩两国与IASB概念框架之间都表现出不同程度的差异,而它们各自之间在这方面也有不同。相比之下,中国基本准则与IASB概念框架对会计要素的分类更相似。可以说,韩国与IASB概念框架在会计要素分类方面的差别,基本上也表现为中韩两国之间在这方面的差异,如韩国设置了现金流量表要素和权益变动表要素,而中国没有设置;韩国设置了综合收益要素,而中国也没有设置。但关于利得和损失的界定,韩国与IASB概念框架的安排基本一致,即只将它们安排为损益表要素,而中国则将其区分为直接计入当期损益的利得与损失和直接计入所有者权益的利得与损失。

(五)在会计计量方面的差异

韩国概念框架对会计计量属性进行了重新归纳,比中国多了企业持有价值和账面净值两个计量属性。由于企业持有价值就是资产或负债的现值,而账面净值就是一种摊余价值。这样来看,中韩两国关于会计计量属性的规范并不存在本质上的差异。中韩两国关于会计计量属性的差别就在于韩国概念框架对会计计量属性进行了重新归纳。另外,韩国概念框架中详尽描述了公允价值的概念,并在第七章第150条关于计量基础的选择原则中指出:“计量资产和负债时,选择哪种计量基础,应从为财务报告的目的服务的信息有用性,即从相关性和可靠性观点出发进行判断。在不存在计量误差的条件下,依照公允价值或企业持有价值的计量将比其他计量基础提供更有用的信息。”

二、中韩两国概念框架产生的背景

中韩两国概念框架都是在进入21世纪以后,在会计准则国际化的一片呼声中、借鉴国际流行的概念框架建立起来的。每一个国家都有自己的经济环境,会计制度的建立要符合各自的经济需求。而除了市场经济发达程度的差异外,政治力量、历史和文化背景也是决定这种差异的重要因素。因此,两者的基本构架以及会计目标理论的导向并不完全相同。

(一)我国的经济背景

我国尚处在经济转轨时期,在经济、社会、文化、法律监督等方面和发达国家存在较大差异。我国的经济背景是市场体系尚不完善,法律制度不够健全,会计造假普遍,会计信息失真现象严重;缺乏充分和公开的市场竞争,企业间的交易行为也不规范,内部治理结构薄弱,政府还具备相当的影响力;我国财务信息的使用者还不能完全以投资者为主。因此,从新准则看我国会计国际趋同,则是充分考虑了我国的客观环境和特点,在对会计目标的考虑上还必须兼顾国家宏观管理、投资者决策和公司内部管理等多方面的需要。

(二)韩国的经济背景

韩国概念框架的目标导向与这几年来韩国经济发展模式的定位是分不开的。1997年韩国经济危机发生的主要原因之一,是韩国企业的政府主导型经济体制,导致的经营不够透明以及会计信息的可信性低下等因素造成的。为了克服金融危机,韩国政府对金融、企业、公共、劳务市场等几个部门进行了大规模的改革,改革的基本方针是从政府主导型经济转换到市场经济,全面采用国际标准的经济发展模式。从改革内容上看,它是以20世纪90年代,美国实施的世界经济的重组模式,即活跃市场经济模式为目标的。为实现这一目标,韩国在会计准则管理模式上进行了改革,试图将韩国的企业会计准则变成面向未来的、具有国际先进水平的会计准则体系,从而尽大可能地在财务报表上正确反映企业经营成果等信息,来增加企业经营的透明度,以提高国外对韩国财务信息的信赖程度。在这样一种经济形势和经济发展目标引导下,韩国概念框架全面借鉴国际流行概念框架的做法就顺理成章了。

总体上,韩国的概念框架在相当大的程度上借鉴IASB和FASB概念框架的特点,会计目标以维护职业投资人利益为导向,会计信息比较强调相关性。而中国的基本准则更具有法规式的概念框架特征,会计目标没有明显偏向职业投资人,会计信息更强调可靠性。

三、对中韩两国概念框架的恰当性评价

地理信息概述篇5

ApplicationAnalysisofHallidayRhemeTheoryin

VocationaltranslationPracticeTeaching

CAIYongfeng

(Hu'nanVocationalCollegeofCommerce,Changsha,Hu'nan410000)

AbstractHallidaythematictheoryformorecontributionshasaverybroadimpact,theintroductionofthematictheoryonthefeasibilityanalysis,basedonthetranslationofappliedvocationaltrainingteaching,translationchapterstructurewillbenefitanalysis,understandingcommunicativemeaningofthetextpassed,andtherealizationofthesourceandtargetlanguagestructureandcontentofthefunction,soastoeffectivelyimprovetranslationefficiencyofteachingandlearning.

Keywordsthematictheory;vocationaltranslationpractice;theoryapplication

1课堂上引入主述位概念的可行性

多年来,随着翻译学科的发展,基于文化视角的翻译理论不胜枚举,如后殖民理论、解构理论、女性主义理论等,为翻译的研究学习提供了新鲜的视角。遗憾的是,此类理论对做实用翻译尤其是适合高职学生的翻译实训学习并没有直接的指导意义。因此,为高职翻译教与学寻求恰当的理论指导成为广大教育工作者的当务之急。韩礼德主述位理论,作为一种实用型语言结构的分析方法,且对于各类语言基础的翻译学习者而言易于接受,逐渐成为翻译语篇分析的有力工具,在应用翻译学习中逐步盛行起来。本文试图在高职翻译实训教学中引入主述位理论,从而提取对高职学生行之有效的翻译策略,研究主述位翻译方法的传授与阐释,以期提高高职翻译实训的教学效能。

2对主述位概念和分类的课堂诠释过程

在高职翻译的实训课堂上,向学生介绍主述位概念和分类,目的是在于培养学生良好的语言运用习惯,而不是让学生进行机械概念记忆。下面是笔者在课堂上对韩礼德主述位概念的释义概要:从语义角度在对句子进行切分时,信息的起点部分为主位,是句中所关心的成分;述位是句中除主位之外的成分,它提供关于主位的新信息(韩礼德:1994)(下文中T为主位,R为述位。)

例如:(1)人力资源部(T)/为本程序的执行部门(R)。(2)OnOctober9,(T)/theanniversarypartywillbeheldinthehall.(R)

从例句可知,因信息起点功能特征,主位通常在句首,但句首仅是其实现位置,而非其实质定义;数位为紧随其后的信息,即起点信息后的新信息。

同时,根据主述位的结构表现形式,韩礼德将主述位划分为单项、复项和句项述位。(此类讲解因限于篇幅,暂不做赘述。)

跟踪当堂实训教学效果,绝大部分学生们表示易于理解和接受上述内容。但教师须注意提醒学生注意与易混淆的主谓语结构区分,以及句中主述位次序的差别。

3课堂上阐释主述位翻译理论的策略与方法

3.1引入新概念―翻译单位,开拓学生思路

传统的翻译课堂中,概念单位通常为句子,教师先要学生模仿现成例句,准备一段时间来做翻译练习,而从学生相应的理解情况来看,对原语和目的语只是从单词到句子零散地翻译。为避免这种情况,笔者采取学生在没有准备的情况下首先要求学生翻译例句:“PrequalifiedrenderermaybegainaseriesoftenderdocumentsforRMB6000yuanonthesubmissionofawrittenapplication.”通常情况下,学生的答案会出现五花八门的现象,大体上可归纳为如下三种译文形式:译文一:合格的投标人要获得一整套投标文件须在交纳人民币6000元,并呈交以上所要求的文件。译文二:合格投标人要获得一整套投标文件须在呈交以上书面申请后,并交纳人民币6000元。译文三:整套招标文件可由具有资格的投标者提交书面申请,并交纳人民币6000元后获得。

显然在三种译文中,最佳翻译为译文三。“在呈交以上书面中请并交纳人民币6000元”为原文的复项述位,而在译文一、二中则被转换为句项述位结构。因此可以看出,将获得标书的资格以及资金条件放于句尾强调,是有悖于招标文书的公平原则的;相比而言,译文三中将“整套招标文件”转至主位,更符合原文发展的逻辑,实现译文文本与英文文本的功能对等。因此,翻译练习引入翻译单位-韩礼德理论下的主位述位,使源语言和目标语言更具结构分析和建构功能,从而使译者易于准确理解与掌握译前分析准备。所以,把主位述位作为翻译单位是一种便于学生理解的学习方式,让学生增强对翻译学习的信心,对拓宽学生的思路和视野有直接益处。

3.2鼓励转换思维,提高信息和句式调整意识

根据主述位理论,作为辨别主述位主要依据的句中信息,对于划分句子结构起着举足轻重的作用。一般而言,零位信息和已知信息表现为多数英语句子中的主位,相比而言,新信息则为句子的述位,经常置于句中谓语动词及后面部分。又如:“ThePretenderConferencewillbeheldon8Juneattheaddress...

同样,对于该句翻译学生也出现不尽相同的译文答案,基本上可归纳为以下两类:译文一:六月八日,标前会议将在某地召开。译文二:标前会议将于六月八日在某地召开。

比较而言,译文二比译文一效果要好:译文二中的“标前会议”,体现为小句主位,与前面各小句主位关联紧密、清晰;而译文一中“六月八日”为小句主位,和前面其它小句主位并任何关联;译文二的目标文本在语篇方面与原文本保持一致,且继续保持了原文本的主位脉络,句式结构紧凑。一般情况下,英语本族语者通过已知信息中选取主位,而通过句末信息选取述位。但是,由于跨文化差距,仅按此方式翻译就不符合汉语的表达习惯,因此,为了让学生更好地了解到英语对新旧信息分布的意识以及和中文句式的差别,在翻译中引导学生进行相应思维转换,提高信息和句式的调整运用能力。

3.3培养篇章结构策略,增强文本翻译能力

篇章翻译是将已知文本语言转换到目的语文本的过程,既是指文字的转换,也是指结构和内容的传递。在高职翻译实训的练习过程中,教师首先引导学生注意目标语言应在风格、信息和内涵方面与原文保持致,以符合目标语的格式和体裁为准。然后,引入适合的翻译方法,采用直译加调整的策略,进而加以归纳。具体应用到工程翻译之招标文书的翻译实训实例,体现为如下分析步骤:划分源文本主述位分析主述位推进模式(T-R模式)识别源文本信息链理清篇章脉络句子翻译篇章翻译。值得注意的是教师可提倡学生用该理论来检测目标译文,检验目标文本是否符合原文本结构和逻辑,是否最大限度地从形式和内容上实现功能对等。

4结语

地理信息概述篇6

【关键词】电子信息工程;现代化技术;刍议

0引言

21世纪是一个信息技术快速更新变化和发展的时代,电子信息技术受到了社会各界极为广泛的关注和重视。毫无疑义,电子信息工程的发展受到人们广泛关注和热议的主要原因在于:我国不断加强科研方面的投资力度,科学技术蒸蒸日上,取得了前所未有的突破性进展和成效。从目前看来,相当一部分行业领域对各自的电子信息技术进行了深化改革和完善,最大限度地提升了我国社会的生产力水平,十分有效地促使我国社会经济水平大幅度攀升。在信息技术中,电子信息工程是其十分重要的组成部分之一,对科学技术的进步和社会长远发展起到至关重要的推动和促进作用。

1电子信息工程的概念及内容概述

一般来说,采用一定的先进技术,科学、合理地控制和处理电子信息的学科被称为电子信息工程。资料显示,电子信息工程研究涉及的范围十分广泛。从某种程度上说,信息系统和电子设备的集成、涉及和开发是信息工程研究内容十分重要的组成部分。随着当今时代的迅猛发展和变化,与传统的电子工程研究内容相比,现有的电子信息工程的范围越来越广,涉及的研究内容越来越丰富。值得肯定的是,相当一部分电子信息工程内容与电子信息工程现代化技术有着十分密切的联系。这些电子信息工程内容包括:信息数据传递、手机声音、网络数据传递、电话信号处理和图像传递等等。实践表明,只有注重和强调在新产品的研发上投入十足的精力、人力、物力,才能十分有力地促使我们更好地掌握的了解这些电子信息工程内容。

2电子信息工程的发展现状

对电子信息工程的概念及内容概述进行了较为系统地了解和阐述之后,接下来,我们全面、深入地探讨电子信息工程的发展现状,希望能够对电子信息工程的现代化技术刍议的实践工作起到一定的启示和帮助作用。

从目前看来,电子信息工程已经渗透到各个领域。在相当一部分领域中,电子信息技术取得了较为广泛的应用和认可,一定程度上加快推动了社会现代化的发展进程。这些领域包括:第三产业、农业和工业等等。随着当前经济水平的大幅度攀升,相当一部分新产品和新技术顺利将行业之间的界限打破和割裂,促使新技术业务的产业链取得了前所未有的突破性进展和成功。从某种程度上说,相关方面只有对大行业管理模式进行较为深入、细致地探讨和了解,才能最大限度地促使行业间的合作更加和谐,共同谋求利润的最大化。实践证明,我国政府在充分尊重市场调节的基础上,科学、合理地制定和完善相应的货币政策和财政政策,十分有利于大大增强电子信息化工程的实用性和科学性,有利于为信息化工程的健康、稳定、长久发展创造比较良好的外部环境。不可否认的是,电子信息工程现代化技术进行深入研究具有一定的必要性和重要性。在实践中,我们不难发现,电子信息工程现代化技术应用的过程中,存在着不少问题和难点,有待我们进一步分析解决和妥善处理。这里需要明确的是,产品市场环境恶劣和国家政策支持力度不够是最为主要的难点问题,应该引起有关方面的关注。

3推动电子信息工程现代化技术发展的措施

对电子信息工程的概念及内容概述进行了较为系统地了解和阐述之后,我们全面、深入地探讨电子信息工程的发展现状,提出了推动电子信息工程现代化技术发展的两点有效措施,希望能够加快推动电子信息工程的现代化技术研究的发展进程。

3.1加强国家政策扶持力度,优化电子信息资源环境

为了加快推动电子信息工程现代化技术发展,为了有效地对电子信息资源环境进行优化和改善,为了进一步确保电子信息产业的长久、稳定发展,中央和地方政府应该最大限度地加强政策方面的支持力度,设立相应的电子信息工程基金,进一步打开融资和投资渠道。从某种程度上说,中央和地方政府只有系统、全面地引导相关工程,并且对这些工程进行科学、合理地适度开发,才能进一步促使技术改造项目和产业自主创新能够顺利进行。这些工程包括:软件信息服务、电子通信产业、数字电视、电影推广和互联网应用等等。

3.2加强现代化技术投资力度,培养创新思维的专业人才

实践表明,只有大力培养电子信息工程的现代化技术创新型人才,才能进一步促使我国电子信息工程更好、更快、更稳地发展。对于广大企业来说,通过不断优化和改善现有的企业环境,不断加强现代化技术投资力度,这在一定程度上给企业的整体印象和实力加分,为相当一部分高素质人才打造了一个充分展示自我,发挥自己才智的平台,从而更好地吸引相关方面的高素质人才积极投身到企业的建设中。更进一步说,企业不断加强现代化技术投资力度,注重培养具有创新思维的技术型人才,能够十分有效地为我国的电子信息工程技术研发注入一定的催化剂,能够促使这些电子信息工程的创新型人才更好地掌握和了解先进的科学知识和前沿理论,能够最大限度地拓宽我们电子信息技术知识面。这里需要明确指出的是,加强电子信息知识产权保护力度,提升产品的服务意识不容忽视。

4结语

毫无疑问,计算机应用具有一定的优势和特点,它作为一种全新的信息传播方法,能够十分有力地推动整个社会经济向制度化、规范化、信息化发展。值得肯定的是,拥有比较强的计算能力是计算机应用的主要优势之一。本文较为系统、全面地阐述了电子信息工程的概念及内容概述,对电子信息工程的发展现状进行了细致地论述,接着,提出了一系列推动电子信息工程现代化技术发展的措施,希望能够进一步实现电子信息工程的现代化技术刍议的预期效果。

【参考文献】

[1]陈鸿.关于实现电子信息工程的现代化技术的探究[J].电子制作,2013(02).

[2]徐周乐.新形势下电子文件及档案信息化的管理策略[J].科技创业家,2011(06).

    【公文范文】栏目
  • 上一篇:信用管理规范(6篇)
  • 下一篇:岩土工程技术专业就业方向(6篇)
  • 相关文章

    推荐文章

    本站专题