CN1419211A - 文件转换系统、转换方法和存储文件转换程序的可读介质 - Google Patents
文件转换系统、转换方法和存储文件转换程序的可读介质 Download PDFInfo
- Publication number
- CN1419211A CN1419211A CN02149391A CN02149391A CN1419211A CN 1419211 A CN1419211 A CN 1419211A CN 02149391 A CN02149391 A CN 02149391A CN 02149391 A CN02149391 A CN 02149391A CN 1419211 A CN1419211 A CN 1419211A
- Authority
- CN
- China
- Prior art keywords
- file
- conversion
- structured
- document
- mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
- G06F40/16—Automatic learning of transformation rules, e.g. from examples
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
- G06F40/143—Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
- G06F40/154—Tree transformation for tree-structured or markup documents, e.g. XSLT, XSL-FO or stylesheets
Abstract
本发明的目的在于通过输出匹配转换后文件类型定义的合适文件数据以便省略文件结构转换中的有效性验证步骤而减少文件转换所需的全部时间。特别是,本发明提供了用于将基于第一文件类型定义D1形成的第一结构文件F1转换成基于第二文件类型定义D2形成的第二结构文件F3的文件转换方法,该文件转换方法包括:分析文件类型定义D1和文件类型定义D2并提取不同文件类型定义;产生其中描述有转换规则的转换模板T2,该转换规则根据分析的结果防止作为文件转换处理结果的结构文件F3与文件类型定义D2矛盾;并且采用转换模板T2完成文件转换处理。
Description
技术领域
本发明涉及一种文件转换系统、文件转换方法和存储文件转换程序的计算机可读记录介质,该文件转换系统用于将由第一文件模式形成的第一结构文件转换成由第二文件模式形成的第二结构文件。
背景技术
本申请基于申请日为2001年11月12日、申请号为P2001-346736在先日本专利申请,并要求其优先权,本文通过参考而合并其全部内容。
通常提出的结构文件不仅处理作为纯粹的字符串的文本文件文本数据,而且能表示文件布局、属性等的逻辑结构。例如,目前提供了由国际标准化组织(ISO)标准8879规定的SGML和由万维网协会(W3C)规定的XML。根据SGML和XML,由文件类型定义(DTD)规定文件的逻辑结构,可以采用称为文件标记的结构单元标识符来表示文件的组成单元的作用,如名称、作者名、序言和文本。
在结构文件中,需要将特定含义或作用等赋值给标识符,并且可以将附加信息(属性)添加给标识符以表示该特征。
另外,提出了描述文件类型的类型表格式,需要将结构文件显示在屏幕上并将结构文件打印在纸上。作为类型表格式,提供了ISO标准10179的规范语言(DSSSL)和由W3C规定的可扩充类型表语言(XSL)。
DSSSL和XSL通过规定一种表示构成SGML或XML的标识符条件的模式和对应满足该的标识符的作用(action),描述了文件类型。
类型表提供了文件类型并转换文件的结构。提取XSL中结构文件特定模式的规范称为XSL变换。XSLT的使用使XML文件得以根据预定条件转换并以不同格式,如HTML输出。
通过将文件数据(文本)划分成单元而产生结构文件,这些单元具有结构意义,并使用元素和属性形成这些单元。在XML中,形成文件数据结构的方法称为规划,通常文件类型定义(DTD)用于定义该规划。规划规定了应该以什么样的顺序对作为文件内容的单元处理和处理多少次,并且应该将什么属性作为文件内容处理。由于结构文件本身没有关于数据的定义,因此即使因为某些原因丢失了数据也不能自动地检查错误。因此,完成文件类型定义以便显示数据或交换数据,并且需要根据定义描述文件。
图1显示了由XML所描述的结构文件F1的传统文件转换处理流程图。如图所示,结构文件的转换处理由两个步骤构成,主要是文件结构的转换S101和其有效性验证处理S102。
文件结构的转换S101是通过采用模式匹配技术提取元素和属性并用新单元对其进行替换或者通过添加新元素、属性和文本而产生新文件的步骤。根据在转换模板T1中描述的转换规则完成该处理。转换模板T1包含结构转换规则,该规则作为XSL文件(转换模板T1)首先产生。期间,可以应用现有软件(如Xalan-C++)作为文件结构转换处理S101的XSLT转换引擎。
有效性验证处理S102是一个验证步骤,验证在转换后XSLT转换处理的输出(结构文件F2)是否按照文件类型定义D2,并且采用转换后的文件类型定义D2完成该处理。可以通过现有软件(如XML4C)执行有效性验证处理S102。如果有效性验证处理S102的结果可以接受,则产生新数据结构文件F3。如果不可以接受,则根据误差内容为结构文件F2完成文件结构校正处理S104,并再次为校正的结构文件F2完成有效性验证处理S102。
图2A是根据转换模板T1将由文件类型定义D1定义形成的结构文件F1转换成结构文件F3的传统示例视图。在图中,第一次转换(i)后的结构文件F2与文件类型定义D2矛盾,而在结构文件F3中,矛盾被校正。在图2A的文件示例中,UL元素和ul元素定义了语句行而没有任何编号(以随机顺序列出),每个语句项用低于UL和ul元素的序列的LI元素和li元素定义。
作为转换后的元素,ul元素和li元素对应UL元素和LI元素。在结构文件F1中,描述了包括三个语句的列表。在包含矛盾的结构文件F2中,替换简单对应元素。
如果有这样的规则,仅一个li元素可以按照在文件类型定义D2中规定的ul元素定义,则每个li元素要成为结构文件F2中ul元素的子元素(每个li元素附加一个ul标记)。因此,将其校正成合适的结构文件F3,该文件F3满足文件类型定义D2。
图2B是描述传统转换模板T1的示例。如图所示,转换模板T1起转换规则的作用,该规则是由结构文件F1向包含矛盾的结构文件F2(i)转换的规则。
转换模板T1包括模式赋值部分和模板赋值部分。
通过转换处理,从结构文件中提取由模式赋值部分定义的文件模式(标记)。另外,为了产生新文件,根据模板赋值部分对提取的文件模式进行添加、删除和替换。
在传统转换模板T1中,<xsl:模板匹配>、<xsl:应用-模板>、<xsl:选择的值>中都是由XSL规范定义的元素。
采用<xsl:模板匹配>的(1)和(3)表示规定模式,(1)表示提取UL元素而(3)表示提取LI元素。(2)和(4)表示指定模板。根据(1)指定的模式提取UL元素,接着指定模板(2)。
指定模板(2)表示在完成对LI元素应用模板规则之后描述开始标记ul和描述终止标记ul。LI元素的模板规则是(3)和(4),并且根据(3)的模式指定提取LI元素。另外,作为(4)的模板指定,描述了开始标记li。按照LI元素的部分被转换成文本,并最后描述终止标记。由于在结构文件F1中有三个LI元素,因此提取对应上述(3)的模式指定的三个部分。另外,分别应用模板指定(4),然后完成该处理。
但是,如上所述,当文件类型定义D1包含与文件类型定义D2的矛盾(如在文件类型定义D2中被禁止的规范)时,如果仅根据转换模板T1提取元素/属性并替换(转换)成对应元素/属性或添加这样的元素/属性,则与文件类型定义D2的矛盾仍保留。
根据传统结构文件转换方法,文件结构转换处理S101和有效性验证处理S102都从文件数据中的路由元素至末端元素搜索元素/属性。因此,存在一个问题,即文件转换要花很长时间作为文件校正处理S104要求的时间。
此外还存在一个问题,即,如果有效性验证处理S102的结果不可接受,则操作者必须在脱机状态根据有效性验证处理S102的结果手动操作完成文件校正处理S104。
发明内容
因此,本发明的目的在于通过输出转换后匹配文件类型定义的合适文件数据以便省略文件结构转换中的有效性验证步骤,从而减少文件转换所需的全部时间。
本发明特征在于,根据基于第一文件模式形成的第一结构文件转换成基于第二文件模式形成的第二结构文件,分析第一文件模式和第二文件模式,并提取不同文件类型定义,产生具有其中描述有转换规则的转换模板,根据分析的结果防止作为文件转换处理结果的第二结构文件与第二文件类型定义矛盾,并且采用转换模板完成文件转换处理。
根据本发明,如果有不满足转换后文件模式(第二文件模式)反映用转换模板校正矛盾的处理的输出逻辑,作为文件结构转换处理结果的第二结构文件可以根据转换后的文件类型适当的被定义。结果,可以省略通常完成的转换后有效性验证步骤,由此,减少文件转换所需的全部时间。
附图说明
图1是传统文件转换方法要点的示意图;
图2A和2B是产生传统转换模板的示例的图表;
图3是本发明文件转换方法要点的示意图;
图4A和4B是本发明实施例描述转换模板的示例的图表;
图5A和5B是产生本发明实施例另一转换模板的示例的图表;
图6A和6B是产生本发明实施例另一转换模板的示例的图表;
图7是根据本发明实施例改进的文件转换方法要点的示意图;
图8是安装有实施例文件转换程序的计算机结构的方框图;
图9是安装有实施例文件转换程序的计算机的处理流程图;
图10是计算机可读记录介质立体图,该介质上存储有实施例文件转换程序;
图11是表示计算机处理的示意图,该计算机上安装有文件转换程序;以及
图12是表示通过采用计算机的通信网络进行文件转换处理的示意图,其中实施例文件转换程序安装在计算机上。
图13是表示有关本发明实施例的标识符对应表和转换规则的表格。
具体实施方式
文件转换方法
下面说明本发明文件转换方法实施例。图3是表示本实施例文件转换方法的要点的示意图。
如图所示,转换模板T2包含合适转换规则的描述,该规则基于在转换前应用的解释文件类型定义D1(第一文件模式)和在转换后应用的文件类型定义D2(第二文件模式),以便根据文件类型定义D2输出结果。在文件结构转换处理S101中,为了产生新的结构文件F3(第二结构文件),根据转换模板T2的描述对作为转换前文件的结构文件F1(第一结构文件)的文件结构进行转换。
可以通过以下处理产生这样的转换模板T2。期间,根据本实施例,文件类型定义D1和文件类型定义D2是文件数据,该文件数据具有用于定义文件如XML和HTML字符串逻辑结构的标识符。
这里形成标识符对应表和转换规则。图13是表示本实施例标识符对应表和转换规则的表格。
如图13所示,标识符对应表是表示定义相同逻辑结构如UL元素和ul元素的元素之间关系的表格。转换规则包括定义转换后逻辑结构的可替换模板和对应该模板的条件。
标识符对应表根据以大写字母表示的元素和小写字母或采用具有相同内容的变元的元素或具有相同功能的元素表示的元素之间的关系产生。按照该标识符对应表,比较转换前后的逻辑结构,并检测它们之间不同的部分。例如,如图2所示,比较结构文件F1中UL元素和LI元素形成的逻辑结构文件类型定义和结构文件F3中ul元素和li元素形成的逻辑结构文件类型定义,以便检测不同部分。
另外,分析这些检测的不同部分的条件。根据图2A所示的示例,如果有多个LI元素(两个或多个),UL元素关于每个LI元素嵌套。因此,在该示例中,采用(LI>=2)作为条件。接着根据转换后的不同部分和对应逻辑结构的条件产生转换规则,转换规则反映在转换模板T2上。
根据该实施例,转换模板T2包括模式指定和模板指定。模式用于指定要被转换的标识符。这里,在标识符对应表中描述的标识符是所述的标识符。图13中指定转换规则的模板被反映并包括用于替换的模板,该模板定义转换后的逻辑结构和对应可替换模板的条件。
图4(a)和4(b)显示了模板规则T12、T22作为本实施例转换模板T2描述的示例。该示例校正了图2中所示的矛盾,并且通过单一转换(图2(iii))输出结构文件F3。根据本实施例的模板规则T12,(5)和(7)表示模式指定。(5)描述了UL元素的提取,而(7)描述了LI元素的提取。此外,(6)和(8)描述了模板指定。
在图4A所示的示例中,首先,提取UL元素,根据(5)的模式指定(6)的模板。模板指定(6)表示一个模板要对应的对象从当前元素(UL)转换为子元素(LI)。LI元素的模板规则是由(7)、(8)表示。
接着,通过(7)模式指定提取LI元素。然后通过(8)模板指定,描述了ul的开始标记,描述了li的开始标记,LI元素后面的部分转换成文本并被描述。最后,描述li和ul的结束标记。
由于转换前的结构文件F1具有如图3所示三个LI元素,提取对应(7)模式指定的三个部分,完成(8)模板指定的处理,以便完成转换处理。
根据图4B所示的模板规则T22,<xsl:每个(for-each)>是通过XSL规范形成的元素之一。(9)表示模式指定,它指定了UL元素的提取。(10)表示模板指定,它指定了多个LI元素的重复处理。至于处理的内容,描述了ul的开始标记,描述了li的开始标记,LI元素之后的部分转换成文本并被描述,接着描述了li和ul的结束标记。由于结构文件F1包含三个元素,利用(10)模板指定中的<xsl:每个>元素重复处理三个元素,接着,完成该处理。
然后,描述另一转换模板的实例。图5(a)、(b)是显示body(主体)元素和blockquote(块引用)元素转换示例的图表。图5A显示了结构文件F13(第一结构文件)、结构文件F32和结构文件F33(第二结构文件),结构文件F13是转换前的文件,结构文件F32是转换后包含矛盾的文件,而结构文件F33是校正了矛盾的文件。图5B示出了本实施例的传统的转换模板T31和转换模板T32。
在该示例文件中,body元素和BODY元素表示文件的主体,blockquote元素和BLOCKQUOTE元素指定显示引用的字符串块。尽管div元素指定了采用类型表的块,但并不总是必须采用类型表。
根据该实施例,如图13所示,采用div元素作为能包含body元素和blockquote元素的元素。根据本实施例,在转换前后,body元素和blockquote元素分别对应BODY元素和BLOCKQUOTE元素。
结构文件F31表示BODY元素下面字符串为文件主体,另外,结构文件F31表示BLOCKQUOTE元素下面字符串块为引用。包含矛盾的结构文件F32简单替换对应的元素。
在文件类型定义D2中,如果规则是字符串不能被直接描述在body元素下面并且指定了blockquote元素,结构文件F32与文件类型定义D2发生矛盾。通过将div元素放置在每个body元素和blockquote元素,结构文件F33校正结构文件F32中的矛盾以便满足文件类型定义D2。
图5B是转换模板规则的说明。传统转换模板规则T31描述了用于在转换(iv)后从结构文件F31向文件F32转换的文件转换模板规则,如图5A所示。校正的转换模板规则T32描述了从结构文件F31向结构文件F33转换的转换规则,在结构文件F33中矛盾得到校正(vi)。
根据传统转换模板规则T31,(11)和(13)分别表示模式指定,(11)指定BODY元素的提取,而(13)指定BLOCKQUOTE元素的提取。(12)和(14)分别表示模板指定。
首先,根据(11)模式指定提取BODY元素,接着指定(12)模板。其次,在(12)的模板中,描述了body的开始标记,模板对应的对象从当前元素(BODY)变换到子元素(BLOCKQUOTE)。模板指定(12)表示在执行了子元素(BLOCKQUOTE)的模板规则的处理之后描述了body的结束标记。
BLOCKQUOTE元素的模板规则由(13)和(14)表示。根据(13)的模式指定提取BLOCKQUOTE元素,并且描述了(14)的模板。在(14)的模板中,描述了blockquote的开始标记,模板对应的对象从当前元素(BLOCKQUOTE)变换到子元素。另外,在子元素的模板规则处理之后,(14)的模板指定描述blockquote的结束标记。
根据传统转换模板规则T31,BODY元素和BLOCKQUOTE元素简单的转换成body元素和blockquote元素。
根据本实施例的转换模板T32,(15)和(17)分别表示模式,并且(15)指定了BODY元素的提取,而(17)指定了BLOCKQUOTE元素的提取。(16)和(18)分别表示模板指定。首先,根据模式指定(15)提取BODY元素,接着指定模板(16)。其次,在模板(16)中,描述了body的开始标记,描述了div的开始标记,模板对应的对象从当前元素(BODY)变换成子元素(BLOCKQUOTE)。(16)的模板指定表示在完成了子元素的模板规则处理后的div和body结束标记的描述,如图5B所示。
BLOCKQUOTE元素的模板规则由(17)和(18)表示。根据(17)的模式指定提取BLOCKQUOTE元素,并且描述了(18)的模板。在模板(18)中,描述了blockquote的开始标记,描述了div的开始标记,模板对应的对象从当前元素(BLOCKQUOTE)变换成子元素。另外,(18)的模板指定表示完成了子元素的模板规则处理后描述div和blockquote的结束标记,如图5B所示。通过使用转换模板T32,BODY元素和BLOCKQUOTE元素分别转换成body元素和blockquote元素,可以将div元素放置在body元素内和blockquote元素内。
另外,说明根据本实施例产生的转换模板规则T2的示例。图6(a)和6(b)是关于ol元素和li元素转换示例的示意图。图6A示出了结构文件F41、结构文件F42和结构文件F43,F41是转换前的文件(第一结构文件),F42是转换后包含矛盾的文件,F43是转换后的文件(第二结构文件),其中校正了矛盾。图6B示出了本实施例的传统转换模板T41和转换模板T42。
ol元素和OL元素产生编号的语句块(排序列表),每个语句项由li元素或LI元素限定,它是低级的ol或OL元素。文件F41表示存在LI元素的部分和OL元素之下不存在LI元素的部分的示例。
如图6A所示,包含矛盾的结构文件F42仅仅替换对应元素。在转换后的文件类型定义中,如果在ol元素之下需要至少一个li元素的规则被指定,则结构文件F42与转换后的文件类型定义矛盾。
结构文件F43校正了结构文件F42中的矛盾以便通过用div元素替换没有li元素的ol元素来满足文件类型定义。
图6B示出了转换模板规则T42的示例。图6B中所示的传统转换模板规则T41描述了在图6A所示的转换(vii)后关于从结构文件F41向结构文件F42转换的转换规则。图6B中所示的转换模板规则T42描述了关于从结构文件F41向结构文件F41(ix)的转换规则。
如图6所示,传统转换模板规则T41还包括指定提取OL元素/LI元素的模式和对应每个模式的模板,OL元素和LI元素仅仅转换成ol元素和li元素。
根据本实施例的转换模板规则T42,(19)和(21)分别表示模式指定。(19)指定OL元素的提取,而(21)指定LI元素的提取。(20)和(22)分别表示模板,首先,根据(19)的模式指定提取OL元素,接着指定(20)的模板。
图6B中<xsl:选择>、<xsl:当>、<xsl:否则>中的每个都是由XSL规范定义的。根据这三个元素的组合完成该处理。如果检测中的条件表达式(“计算(LI)!=′0′”)结果是真,则执行元素<xsl:否则>中的处理。
在条件表达式(“计算(LI)!=′0′”)下,记录LI元素的量,如果存在一个或多个LI元素,结果是真。在这种情况下,根据<xsl:当>元素的模板描述ol的开始标记,接着执行对LI元素的模板规则处理。此后,描述ol结束标记。
另外,根据条件表达式(“计算(LI)!=′0′”),如果LI元素的量是0,则结果是假。在这种情况下,根据<xsl:否则>元素的模板描述了div开始标记,接着模板对应的对象从当前元素(OL)变换到子元素。在完成了子元素的模板规则处理后,描述div结束标记。根据转换模板规则T42,如果在ol元素之下不存在li元素,则ol元素可以由div元素替换。
上述本实施例的文件转换方法可以作图7所示的改进。图7示出了转换处理示例,其中结构文件不按照XML,如I模式(通过因特网的蜂窝电话信息服务)的压缩HTML文件,该结构文件作为转换前的结构文件(第一结构文件)。在该改进中,将通过使用整形工具的整形处理S201添加到上述实施例中。
在该改进的示例中,文件需要在XML的文件类型定义(DTD)之后,以便启动XSLT引擎作为文件结构转换工具。XML文件需要具有说明语句如XML说明,需要将所有元素准确地描述在嵌套结构中。执行整形处理S201以便整形结构文件F1,该结构文件不以(合适)XML为基础以处在XML的规范之后。在整形处理S201中,完成接下来的处理。
处理的内容是校正开始标记和结束标记的嵌套,如果不附加结束标记则添加结束标记,等等。另外,处理的内容是,如果存在空元素(如BR//)则插入’/’,用双引用包围属性值,如果已经省略了属性值则添加属性值,将元素名和属性名校正成小写字母,等等。
如图7所示,执行整形处理S201以便在转换前形成结构文件F1而按照XML的规范。在整形处理S201中,可以使用自由软件(如HTML Tidy)。对通过整形处理S201整形的文件执行文件结构转换S101,以便产生新的结构文件F3。转换模板T2通过解释转换前的文件类型定义D1和文件类型定义2描述了合适的转换规则,以便根据转换后文件类型定义D2输出结果。一旦执行了“整形的”结构文件F1向新结构文件F3转换的文件结构转换S101,则处理完成。文件转换程序和文件转换系统
通过个人计算机或工作站可以实现上述文件转换方法,该个人计算机或工作站上安装有由合适计算机语言描述的程序。如果在计算机上安装了这样的文件转换系统,则该计算机起文件转换系统的作用。
图8是方框图,示出了计算机1的结构,其中安装有文件转换程序。如图所示,计算机1包括硬盘11、打印机接口12、显示器接口13、I/O设备14、存储器15、通信设备16、CPU 17和用于连接这些设备的总线18等等。
硬盘11是存储各种数据的记录介质。通过I/O设备读取的各种数据存储在硬盘11中,根据CPU 17的请求将数据输出给存储器15或CPU 17。另外,作为每个设备中处理结果的数据还存储在硬盘11中。硬盘11存储文件转换程序P1,启动文件转换程序P1并根据CPU 17的控制对其进行控制。
打印机接口12是用于将计算机1连接于外部打印机等的设备,根据CPU 17的请求执行文件打印。显示器接口13根据由CPU 17产生的显示数据显示图象,并显示控制文件转换程序P1或各种处理结果的合适图像。
通信设备16是LAN卡或调制解调器这样的通信设备,它通过通信线路将计算机1与通信网络20如因特网连接以便发送/接收数据。计算机1能接收来自外部终端的数据,或通过通信设备16发送转换的文档文件。
I/O设备14是从/向外部记录介质如软盘驱动器和CD-ROM驱动器读/写数据的设备。根据本实施例,输入/输出转换模板T2文件类型定义D1、D2和结构文件F1/F3。
存储器15是在CPU 17执行处理时暂时存储数据的主存储器设备。存储器15保持从硬盘11读出的数据或由CPU 17执行的处理结果。
CPU 17是中央处理设备,它通过执行由硬盘11读出的文件转换程序P1,起文件类型定义分析器17a、转换模板发生器17b、文件结构转换器17c、整形器17d、文件I/O设备17e、通信处理器17f、显示数据发生器17g和打印处理器17h的作用。
文件类型定义分析器17a分析文件类型定义D1和转换后的文件类型定义,并提取这些文件类型定义之间的差异。根据本实施例,文件类型定义分析器17a包括用于存储标识符对应表的标识符对应表存储设备,其中链接转换前文件类型定义的标识符和转换后文件类型定义的标识符,逻辑结构提取设备用于提取由文件类型定义D1标识符定义的第一逻辑结构以及由文件类型定义D2的标识符定义的第二逻辑结构,条件检测器根据标识符对应表比较第一逻辑结构和第二逻辑结构,并分析基于两种结构之间不同部分的条件。
标识符对应表存储设备可以为CPU 17内的超高速缓冲存储器,还可以使用硬盘11或存储器15作为辅助手段。
逻辑结构提取设备读取按顺序包含在文件类型定义D1和D2的数据并采用在标识符对应表中描述的标识符改变数据。如果检测到匹配标识符,逻辑结构提取设备通过在标识符之下产生的参考逻辑结构提取其模式。
状态检测器比较在转换前/后为文件类型定义D1和D2指定的规则,以便检测产生差异的条件。例如,如果在UL之下存在任何LI元素,则条件检测器检测了模式中产生差异的条件。
转换模板发生器17b根据文件定义分析器17a的结果产生转换模板T1。转换模板T1描述了结构文件F2的转换规则,它是文件转换的结果以避免与文件类型定义D2的任何矛盾。根据本实施例,转换模板发生器17b产生基于上述条件的转换规则,该条件是关于差异部分和其转换(从D2提取的模式)后的对应逻辑结构的条件。转换模板发生器17b接着使标识符对应表与转换规则互相关联并将其转换成转换模板的格式。
文件结构转换器17c采用转换模板处理文件转换。文件结构转换器替换在标识符对应表中的标识符,并将附加的变元转换成标识符。另外,文件结构转换器17c根据用于替换的模板添加、删除和转换与上述条件匹配的标识符的逻辑结构。
整形器17d整形第一结构文件F1,以便通过文件结构转换器17c进行转换,并矫正结构文件F1中的错误描述(这对于已整形文件来说不需要,如XML)。特别是,整形器17d矫正开始标记和结束标记的嵌套,如果结束标记没有附加则添加该结束标记。另外,如果空元素存在(如:BR//)则整形器17d插入“/”,用双引用包围属性值,如果属性值已经省略则添加属性值,将元素名和属性名矫正成小写字母,等等。
文件I/O设备17e控制文件的输入/输出和硬盘11以及I/O设备14的操作。特别是,文件I/O设备17e读取结构文件F1、转换模板T2和标识符对应表等等。文件I/O设备17e还通过I/O设备14将结构文件F3存储在硬盘11中并将其写入软盘或CD-R中等。另外,文件I/O设备17e向要求的通信处理器17f或打印处理器17h输入或从要求的通信处理器17f或打印处理器17h输出每个文件。
通信处理器17f控制通信设备16,并通过通信设备连接网络20,以便向/从外部终端发送/接收结构文件F1和结构文件F3。通信处理器17f还通过通信设备16接收来自其它终端的文件转换请求。
显示器数据发生器17g产生显示在屏幕上的图像数据并控制显示器接口13。图像数据通过显示器接口13显示在外部显示器上。显示器数据包括根据文件转换程序P1得以产生的图形数据,显示器数据用于显示控制每个处理和检查每个图像。
打印处理器17h控制打印机接口12以通过外部打印机打印结构文件F3。
操作
可以通过在个人计算机等上描述的文件转换程序获得执行文件转换系统。参照图9描述该文件转换系统的操作。图9是显示文件转换系统处理的流程图。
如图9所示,读取转换前的文件类型定义D1并对其分析(S201)。此外,从I/O设备14或硬盘11读出文件并通过文件类型定义分析器17a对其进行分析。同样地,读取转换后的文件类型定义D2并对其进行分析(S202)。此后,产生转换模板(S203)。特别是,文件类型定义分析器17a分析文件类型定义D1/D2,并提取这些文件类型定义之间的差异。
接着,读出结构文件F1(S204),如果需要整形则对读出的结构文件F1整形,并转换整形文件的文件结构(S206)。
接着,输出转换的结构文件F3(S207)。输出包括将其读入I/O设备14或硬盘11,通过通信设备16将其发送到网络20,并通过打印机接口13将其打印出来。
计算机可读记录介质存储文件转换程序
上述文件转换程序可以存储在可由计算机1读取的记录介质中。该计算机可读记录介质包括,如图10所示,软盘216、CD-ROM 218、磁带219等等。
如图11所示,存储这样的文件转换程序的计算机可读记录介质通过采用计算机30如笔记本型个人计算机、桌面个人计算机或工作站实现文件转换。
例如,当得以转换的结构文件F1存储在文件中,如图11所示,通过计算机30转换存储在本地磁盘中的结构文件,计算机30中安装有上述文件转换程序作为文件转换器。
尽管已经描述了上述实施例,其中储存结构文件F1、F3的硬盘11和用于算术运算的CPU 17等装在单个计算机内,本发明不限于该实施例。例如,上述对应设备可以分散装在多个计算机上。
图12是示意图,显示了上述对应设备分散装在多个计算机上的实例。如图所示,得以转换的结构文件F1存储在内容服务器401,该服务器与万维网(WWW)连接。可以根据由客户终端403发出的转换请求通过转换服务器402转换结构文件F1。
在这种情况下,使用安装有上述文件转换程序的转换服务器402。转换服务器402连接通信网络(如因特网)。转换服务器402包括接收器,用于通过通信网络接收来自客户终端403的转换请求并获得来自内容服务器401的结构文件F1。转换服务器402还包括发送器,用于通过通信网络向客户终端设备403发送转换后的结构文件F3。可以使用上述通信设备16作为发送器和接收器。
如上所述,根据本发明第一方面,由于通过用结构文件转换中的合适转换模板进行替换,省略了有效性验证步骤,文件结构转换的总时间可以减少。
已经通过实施例详细描述了本发明。对本领域的技术人员来说显而易见本发明不限于上述的实施例。可以不背离由权利要求范围限定的要旨和范围而以修改或改进的实施例实现本发明。因此,本说明书的目的在于给出示例而不是对本发明作任何限制。
Claims (15)
1.一种文件转换系统,用于将基于第一文件模式形成的第一结构文件转换成基于第二文件模式形成的第二结构文件,所述文件转换系统包括:
文件类型定义分析器,用于分析第一文件模式和第二文件模式,并提取不同文件类型定义;
转换模板发生器,用于产生其中具有描述转换规则的转换模板,根据由文件类型定义分析器完成的分析结果,所述转换规则防止作为文件转换处理结果的第二结构文件与第二文件模式矛盾;以及
文件结构转换器,用于采用转换模板完成文件转换处理。
2.如权利要求1所述的文件转换系统,其中,第一文件模式和第二文件模式各自具有标识符,用于限定构成文件的字符串逻辑结构,
该文件类型定义分析器包括:
标识符对应表存储器,用于存储标识符对应表,所述标识符对应表形成第一文件模式的标识符和第二文件模式的标识符之间的对应;
逻辑结构提取元素,用于提取由第一文件模式的标识符限定的第一逻辑结构和由第二文件模式的标识符限定的第二逻辑结构;以及
条件检测器,用于根据标识符对应表通过比较第一逻辑结构和第二逻辑结构而检测两结构之间的部分差异,并分析由检测的差异部分产生的条件,以及
转换模板发生器,用于基于检测的差异部分的条件及其对应的第二逻辑结构,产生转换规则。
3.如权利要求1所述的文件转换系统,进一步包括文件记录器,用于存储第一结构文件和第二结构文件作为文件数据,其中
文件结构转换器转换由文件记录器读出的第一结构文件。
4.如权利要求1所述的文件转换系统,进一步包括:
接收器,所述接收器连接通信网络以获得来自通信网络的转换请求和第一结构文件;以及
发送器,用于向通信网络发送由结构文件转换器转换的第二结构文件。
5.如权利要求1所述的文件转换系统,进一步包括整形器,用于校正第一结构文件描述中的错误,使得可以通过文件结构转换器读取第一结构文件。
6.一种文件转换方法,用于将基于第一文件模式形成的第一结构文件转换成基于第二文件模式形成的第二结构文件,所述文件转换方法包括步骤:
(A)分析第一文件模式和第二文件模式并提取不同文件类型定义;
(B)产生其中描述有转换规则的转换模板,所述转换规则根据分析结果防止作为文件转换处理结果的第二结构文件与第二文件模式矛盾;以及
(C)采用所述转换模板完成文件转换处理。
7.如权利要求6所述的文件转换方法,其中第一文件模式和第二文件模式各自具有标识符,用于限定构成文件的字符串逻辑结构,
该步骤(A)包括步骤:
(A-1)提取由第一文件模式的标识符限定的第一逻辑结构和由第二文件模式的标识符限定的第二逻辑结构;
(A-2)根据标识符对应表通过比较第一逻辑结构和第二逻辑结构而检测两结构之间的差异,所述标识符对应表形成第一文件模式的标识符和第二文件类型的标识符之间的对应;和
(A-3)分析由检测的差异部分产生的条件,以及
该步骤(B)是用于产生转换规则,所述转换规则基于检测的不同部分及其对应第二逻辑结构的条件而产生的。
8.如权利要求6所述的文件转换方法,其中第一结构文件和第二结构文件存储在文件记录器中作为文件数据,以及
该步骤(C)是用于转换从文件记录器中读取的第一结构文件。
9.如权利要求6所述的文件转换方法,进一步包括:
从通信网络获得转换请求和第一结构文件的步骤,以及
在步骤(C)中向所述通信网络发送转换的第二结构文件的步骤。
10.如权利要求6所述的文件转换方法,其中步骤(C)包括:校正第一结构文件描述中的错误的步骤,以便可以读取第一结构文件。
11.一种存储文件转换程序的计算机可读记录介质,其基于第一文件模式形成的第一结构文件转换成基于第二文件模式形成的第二结构文件,使计算机执行的处理包括以下步骤:
(A)分析第一文件模式和第二文件模式并提取不同文件类型定义;
(B)产生其中描述有转换规则的转换模板,该规则根据分析的结果防止作为文件转换处理的第二结构文件与第二文件模式矛盾;以及
(C)采用转换模板完成文件转换处理。
12.如权利要求11所述的存储文件转换程序的计算机可读记录介质,其中第一文件模式和第二文件模式各自具有标识符,用于限定构成文件的字符串逻辑结构,
该步骤(A)包括步骤:
(A-1)提取由第一文件模式的标识符限定的第一逻辑结构和由第二文件模式的标识符限定的第二逻辑结构;
(A-2)根据识别器对应表通过两比较结构检测第一逻辑结构和第二逻辑结构之间差异的部分,该对应表形成第一文件模式的标识符和第二文件模式的标识符之间的对应;以及
(A-3)分析由检测的差异部分产生的条件,以及
该步骤(B)是用于根据检测的不同部分及其对应的第二逻辑结构产生转换规则。
13.如权利要求11所述的存储文件转换程序的计算机可读记录介质,其中第一结构文件和第二结构文件存储在文件记录器中作为文件数据,以及
步骤(C)是用于转换由文件记录器读取的第一结构文件。
14.如权利要求11所述的存储文件转换程序的计算机可读记录介质,进一步包括从通信网络获得转换请求和第一结构文件的步骤,以及
将转换的第二结构文件发送到步骤(C)中的通信网络的步骤。
15.如权利要求11所述的存储文件转换程序的计算机可读记录介质,其中,步骤(C)包括校正第一结构文件描述中的错误的步骤,以便可以读取第一结构文件。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001-346736 | 2001-11-12 | ||
JP2001346736A JP2003150586A (ja) | 2001-11-12 | 2001-11-12 | 文書変換システム、文書変換方法及び文書変換プログラムを記録したコンピュータ読み取り可能な記録媒体 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2004100969539A Division CN1612136A (zh) | 2001-11-12 | 2002-11-12 | 文件转换系统以及文件转换方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1419211A true CN1419211A (zh) | 2003-05-21 |
Family
ID=19159847
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2004100969539A Pending CN1612136A (zh) | 2001-11-12 | 2002-11-12 | 文件转换系统以及文件转换方法 |
CN02149391A Pending CN1419211A (zh) | 2001-11-12 | 2002-11-12 | 文件转换系统、转换方法和存储文件转换程序的可读介质 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2004100969539A Pending CN1612136A (zh) | 2001-11-12 | 2002-11-12 | 文件转换系统以及文件转换方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US7139975B2 (zh) |
EP (1) | EP1313032A1 (zh) |
JP (1) | JP2003150586A (zh) |
KR (1) | KR100486138B1 (zh) |
CN (2) | CN1612136A (zh) |
AU (1) | AU2002301951B2 (zh) |
CA (1) | CA2411459A1 (zh) |
TW (1) | TWI267004B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101968784A (zh) * | 2010-10-13 | 2011-02-09 | 无锡永中软件有限公司 | 一种数字格式转换的方法与装置 |
CN109947771A (zh) * | 2018-08-20 | 2019-06-28 | 中国平安人寿保险股份有限公司 | 文件类型的转换方法、装置、设备和计算机可读存储介质 |
CN111210027A (zh) * | 2018-11-22 | 2020-05-29 | 横河电机株式会社 | 数据生成装置、数据生成方法、数据生成程序及存储介质 |
CN112560401A (zh) * | 2020-12-22 | 2021-03-26 | 成都海光微电子技术有限公司 | Verilog文件转换方法、装置、存储介质及设备 |
Families Citing this family (53)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3972323B2 (ja) * | 2001-09-04 | 2007-09-05 | インターナショナル・ビジネス・マシーンズ・コーポレーション | スキーマ生成装置、データ処理装置及びその方法並びにプログラム |
US7831905B1 (en) * | 2002-11-22 | 2010-11-09 | Sprint Spectrum L.P. | Method and system for creating and providing web-based documents to information devices |
JP4267336B2 (ja) * | 2003-01-30 | 2009-05-27 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 構造パターン候補を生成する方法、システムおよびプログラム |
JP4676136B2 (ja) * | 2003-05-19 | 2011-04-27 | 株式会社日立製作所 | 文書構造検査方法および装置 |
WO2005003965A2 (en) * | 2003-06-25 | 2005-01-13 | Siemens Medical Solutions Health Services Corporation | Data migration and format transformation system |
AU2003903306A0 (en) | 2003-06-27 | 2003-07-10 | Common Ground Publishing Pty Ltd | Method and apparatus for extending the range of useability of ontology driven systems and for creating interoperability between different mark-up schemas for the creation, location and formatting of digital content |
AU2004252575B2 (en) * | 2003-06-27 | 2009-05-21 | Common Ground Publishing Pty Ltd | Method and apparatus for the creation, location and formatting of digital content |
EP1649384A2 (en) * | 2003-07-11 | 2006-04-26 | Computer Associates Think, Inc. | System and method for generating html based on common xslt |
CA2438362C (en) * | 2003-08-26 | 2011-05-31 | John William Comeau | A method and system for synchronizing a client user interface with server backend |
US20050114765A1 (en) * | 2003-11-25 | 2005-05-26 | Gudenkauf John C. | Producing a page of information based on a dynamic edit form and one or more transforms |
JP2005234837A (ja) * | 2004-02-19 | 2005-09-02 | Fujitsu Ltd | 構造化文書処理方法、構造化文書処理システム及びそのプログラム |
US7607120B2 (en) * | 2004-04-20 | 2009-10-20 | Hewlett-Packard Development Company, L.P. | Method and apparatus for creating data transformation routines for binary data |
WO2006017944A1 (en) * | 2004-08-16 | 2006-02-23 | Abb Research Ltd | Method and system for bi-directional data conversion between iec 61970 and iec 61850 |
AU2005277150B2 (en) * | 2004-08-21 | 2011-05-26 | Directworks, Inc. | Methods, systems, and apparatuses for extended enterprise commerce |
KR100636177B1 (ko) | 2004-09-20 | 2006-10-19 | 삼성전자주식회사 | 정책 기반 확장성 생성 언어 문서 출력 관리 방법 및 시스템 |
JP4666996B2 (ja) * | 2004-10-21 | 2011-04-06 | キヤノン株式会社 | 電子ファイリングシステム、電子ファイリング方法 |
JP4868733B2 (ja) * | 2004-11-25 | 2012-02-01 | キヤノン株式会社 | 構造化文書処理装置及び構造化文書処理方法、プログラム |
US7693848B2 (en) * | 2005-01-10 | 2010-04-06 | Xerox Corporation | Method and apparatus for structuring documents based on layout, content and collection |
US8706475B2 (en) | 2005-01-10 | 2014-04-22 | Xerox Corporation | Method and apparatus for detecting a table of contents and reference determination |
US7937653B2 (en) * | 2005-01-10 | 2011-05-03 | Xerox Corporation | Method and apparatus for detecting pagination constructs including a header and a footer in legacy documents |
JP4539386B2 (ja) * | 2005-03-16 | 2010-09-08 | 富士ゼロックス株式会社 | 電子フォーム印刷装置 |
US8302002B2 (en) * | 2005-04-27 | 2012-10-30 | Xerox Corporation | Structuring document based on table of contents |
US7818667B2 (en) * | 2005-05-03 | 2010-10-19 | Tv Works Llc | Verification of semantic constraints in multimedia data and in its announcement, signaling and interchange |
JP2006351002A (ja) | 2005-05-17 | 2006-12-28 | Fuji Xerox Co Ltd | 文書検証装置、文書検証方法およびプログラム |
US7703006B2 (en) * | 2005-06-02 | 2010-04-20 | Lsi Corporation | System and method of accelerating document processing |
US7743327B2 (en) | 2006-02-23 | 2010-06-22 | Xerox Corporation | Table of contents extraction with improved robustness |
US7890859B2 (en) * | 2006-02-23 | 2011-02-15 | Xerox Corporation | Rapid similarity links computation for table of contents determination |
US8407585B2 (en) * | 2006-04-19 | 2013-03-26 | Apple Inc. | Context-aware content conversion and interpretation-specific views |
KR100910061B1 (ko) | 2006-09-26 | 2009-07-30 | 한국전자통신연구원 | 디지털 방송을 위한 메타데이터 부호화/복호화 장치 및 그방법 |
US7979793B2 (en) * | 2007-09-28 | 2011-07-12 | Microsoft Corporation | Graphical creation of a document conversion template |
US7941399B2 (en) | 2007-11-09 | 2011-05-10 | Microsoft Corporation | Collaborative authoring |
US20090132676A1 (en) * | 2007-11-20 | 2009-05-21 | Mediatek, Inc. | Communication device for wireless virtual storage and method thereof |
US8028229B2 (en) * | 2007-12-06 | 2011-09-27 | Microsoft Corporation | Document merge |
US8825758B2 (en) | 2007-12-14 | 2014-09-02 | Microsoft Corporation | Collaborative authoring modes |
JP5248145B2 (ja) * | 2008-03-05 | 2013-07-31 | 株式会社日立製作所 | 情報提供サーバ、プログラム、情報提供方法及び情報提供システム |
US8301588B2 (en) * | 2008-03-07 | 2012-10-30 | Microsoft Corporation | Data storage for file updates |
US20090240628A1 (en) * | 2008-03-20 | 2009-09-24 | Co-Exprise, Inc. | Method and System for Facilitating a Negotiation |
US8352870B2 (en) * | 2008-04-28 | 2013-01-08 | Microsoft Corporation | Conflict resolution |
US8825594B2 (en) * | 2008-05-08 | 2014-09-02 | Microsoft Corporation | Caching infrastructure |
US8429753B2 (en) * | 2008-05-08 | 2013-04-23 | Microsoft Corporation | Controlling access to documents using file locks |
US8417666B2 (en) * | 2008-06-25 | 2013-04-09 | Microsoft Corporation | Structured coauthoring |
US20100005112A1 (en) * | 2008-07-01 | 2010-01-07 | Sap Ag | Html file conversion |
US11832024B2 (en) | 2008-11-20 | 2023-11-28 | Comcast Cable Communications, Llc | Method and apparatus for delivering video and video-related content at sub-asset level |
US20100131836A1 (en) * | 2008-11-24 | 2010-05-27 | Microsoft Corporation | User-authored notes on shared documents |
US8346768B2 (en) * | 2009-04-30 | 2013-01-01 | Microsoft Corporation | Fast merge support for legacy documents |
US9063800B2 (en) | 2010-05-26 | 2015-06-23 | Honeywell International Inc. | Automated method for decoupling avionics application software in an IMA system |
US9727748B1 (en) * | 2011-05-03 | 2017-08-08 | Open Invention Network Llc | Apparatus, method, and computer program for providing document security |
US9275554B2 (en) * | 2013-09-24 | 2016-03-01 | Jimmy M Sauz | Device, system, and method for enhanced memorization of a document |
CN105302775A (zh) * | 2014-06-30 | 2016-02-03 | 鸿合科技有限公司 | 一种文件格式转换方法及装置 |
US11783382B2 (en) | 2014-10-22 | 2023-10-10 | Comcast Cable Communications, Llc | Systems and methods for curating content metadata |
US11003835B2 (en) * | 2018-10-16 | 2021-05-11 | Atos Syntel, Inc. | System and method to convert a webpage built on a legacy framework to a webpage compatible with a target framework |
CN112416190B (zh) * | 2019-08-23 | 2022-05-06 | 珠海金山办公软件有限公司 | 一种显示文档的方法及装置 |
KR102471587B1 (ko) * | 2019-11-28 | 2022-11-28 | 한국과학기술정보연구원 | 문서변환장치 및 그 동작 방법 |
Family Cites Families (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5299304A (en) * | 1991-04-16 | 1994-03-29 | International Business Machines Corporation | Method and apparatus for identifying multiple stage document format transformations |
US5491628A (en) * | 1993-12-10 | 1996-02-13 | Xerox Corporation | Method and apparatus for document transformation based on attribute grammars and attribute couplings |
JPH07319917A (ja) * | 1994-05-24 | 1995-12-08 | Fuji Xerox Co Ltd | 文書データべース管理装置および文書データべースシステム |
US5915259A (en) * | 1996-03-20 | 1999-06-22 | Xerox Corporation | Document schema transformation by patterns and contextual conditions |
JP3605941B2 (ja) * | 1996-05-20 | 2004-12-22 | 富士ゼロックス株式会社 | 文書構造作成装置及び文書構造作成方法 |
JPH10307818A (ja) * | 1997-05-08 | 1998-11-17 | Nec Corp | 文書変換システム、文書変換方法および文書変換用プログラムを記録した記録媒体 |
US6182092B1 (en) * | 1997-07-14 | 2001-01-30 | Microsoft Corporation | Method and system for converting between structured language elements and objects embeddable in a document |
JP3843574B2 (ja) | 1998-01-26 | 2006-11-08 | 富士ゼロックス株式会社 | 文書変換規則生成装置、文書変換規則生成方法及び文書変換規則生成プログラムを記録したコンピュータ読み取り可能な記録媒体 |
US6115686A (en) * | 1998-04-02 | 2000-09-05 | Industrial Technology Research Institute | Hyper text mark up language document to speech converter |
US6473805B2 (en) * | 1998-06-08 | 2002-10-29 | Telxon Corporation | Method and apparatus for intergrating wireless and non-wireless devices into an enterprise computer network using an interfacing midware server |
US6424980B1 (en) * | 1998-06-10 | 2002-07-23 | Nippon Telegraph And Telephone Corporation | Integrated retrieval scheme for retrieving semi-structured documents |
US6336124B1 (en) | 1998-10-01 | 2002-01-01 | Bcl Computers, Inc. | Conversion data representing a document to other formats for manipulation and display |
KR100415996B1 (ko) * | 1998-10-12 | 2004-01-31 | 삼성전자주식회사 | 웹서버에 의한 html문서의 제공방법 |
CA2255047A1 (en) * | 1998-11-30 | 2000-05-30 | Ibm Canada Limited-Ibm Canada Limitee | Comparison of hierarchical structures and merging of differences |
US6535896B2 (en) | 1999-01-29 | 2003-03-18 | International Business Machines Corporation | Systems, methods and computer program products for tailoring web page content in hypertext markup language format for display within pervasive computing devices using extensible markup language tools |
JP2000339312A (ja) * | 1999-05-31 | 2000-12-08 | Toshiba Corp | 文書編集システム及びタグ情報管理テーブル作成方法 |
US6502112B1 (en) * | 1999-08-27 | 2002-12-31 | Unisys Corporation | Method in a computing system for comparing XMI-based XML documents for identical contents |
FR2811782B1 (fr) | 2000-07-12 | 2003-09-26 | Jaxo Europ | Systeme de conversion de documents a structure arborescente par parcours selectif de ladite structure |
US6681223B1 (en) * | 2000-07-27 | 2004-01-20 | International Business Machines Corporation | System and method of performing profile matching with a structured document |
US6694338B1 (en) * | 2000-08-29 | 2004-02-17 | Contivo, Inc. | Virtual aggregate fields |
US7970437B2 (en) * | 2000-11-29 | 2011-06-28 | Nokia Corporation | Wireless terminal device with user interaction system |
US7152205B2 (en) * | 2000-12-18 | 2006-12-19 | Siemens Corporate Research, Inc. | System for multimedia document and file processing and format conversion |
JP2002259362A (ja) | 2001-02-28 | 2002-09-13 | Fujitsu Ltd | 文書変換定義生成プログラム |
US6964025B2 (en) * | 2001-03-20 | 2005-11-08 | Microsoft Corporation | Auto thumbnail gallery |
US6725231B2 (en) * | 2001-03-27 | 2004-04-20 | Koninklijke Philips Electronics N.V. | DICOM XML DTD/schema generator |
US20020184263A1 (en) * | 2001-05-17 | 2002-12-05 | Pierre Perinet | Method and system for converting usage data to extensive markup language |
US7099885B2 (en) * | 2001-05-25 | 2006-08-29 | Unicorn Solutions | Method and system for collaborative ontology modeling |
US20030145305A1 (en) * | 2001-11-16 | 2003-07-31 | Mario Ruggier | Method for developing and managing large-scale web user interfaces (WUI) and computing system for said WUI |
US8032828B2 (en) * | 2002-03-04 | 2011-10-04 | Hewlett-Packard Development Company, L.P. | Method and system of document transformation between a source extensible markup language (XML) schema and a target XML schema |
US7069497B1 (en) * | 2002-09-10 | 2006-06-27 | Oracle International Corp. | System and method for applying a partial page change |
US20040181748A1 (en) * | 2003-03-10 | 2004-09-16 | International Business Machines Corporation | Thin client framework deployment of spreadsheet applications in a web browser based environment |
-
2001
- 2001-11-12 JP JP2001346736A patent/JP2003150586A/ja active Pending
-
2002
- 2002-11-08 CA CA002411459A patent/CA2411459A1/en not_active Abandoned
- 2002-11-11 EP EP02025041A patent/EP1313032A1/en not_active Ceased
- 2002-11-11 AU AU2002301951A patent/AU2002301951B2/en not_active Ceased
- 2002-11-11 TW TW091133064A patent/TWI267004B/zh not_active IP Right Cessation
- 2002-11-12 KR KR10-2002-0070022A patent/KR100486138B1/ko not_active IP Right Cessation
- 2002-11-12 US US10/291,568 patent/US7139975B2/en active Active
- 2002-11-12 CN CNA2004100969539A patent/CN1612136A/zh active Pending
- 2002-11-12 CN CN02149391A patent/CN1419211A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101968784A (zh) * | 2010-10-13 | 2011-02-09 | 无锡永中软件有限公司 | 一种数字格式转换的方法与装置 |
CN109947771A (zh) * | 2018-08-20 | 2019-06-28 | 中国平安人寿保险股份有限公司 | 文件类型的转换方法、装置、设备和计算机可读存储介质 |
CN109947771B (zh) * | 2018-08-20 | 2023-07-21 | 中国平安人寿保险股份有限公司 | 文件类型的转换方法、装置、设备和计算机可读存储介质 |
CN111210027A (zh) * | 2018-11-22 | 2020-05-29 | 横河电机株式会社 | 数据生成装置、数据生成方法、数据生成程序及存储介质 |
CN112560401A (zh) * | 2020-12-22 | 2021-03-26 | 成都海光微电子技术有限公司 | Verilog文件转换方法、装置、存储介质及设备 |
CN112560401B (zh) * | 2020-12-22 | 2024-04-09 | 成都海光微电子技术有限公司 | Verilog文件转换方法、装置、存储介质及设备 |
Also Published As
Publication number | Publication date |
---|---|
CA2411459A1 (en) | 2003-05-12 |
US20030093760A1 (en) | 2003-05-15 |
JP2003150586A (ja) | 2003-05-23 |
TWI267004B (en) | 2006-11-21 |
TW200300233A (en) | 2003-05-16 |
KR100486138B1 (ko) | 2005-04-28 |
CN1612136A (zh) | 2005-05-04 |
AU2002301951B2 (en) | 2007-07-12 |
EP1313032A1 (en) | 2003-05-21 |
KR20030040113A (ko) | 2003-05-22 |
US7139975B2 (en) | 2006-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1419211A (zh) | 文件转换系统、转换方法和存储文件转换程序的可读介质 | |
JP5623079B2 (ja) | ハード・コピーの書式からの書式定義の自動発生 | |
CA2661902C (en) | Automated classification of document pages | |
US20090110288A1 (en) | Document processing apparatus and document processing method | |
CN1115622C (zh) | 信息处理设备及方法 | |
CN1808377A (zh) | 由非专属语言驱动的通用序列图生成器 | |
US20090177653A1 (en) | Image processing apparatus and image processing method | |
CN101048728A (zh) | 文档管理系统及其方法 | |
CN1763748A (zh) | 电子归档系统和电子归档方法 | |
CN1719865A (zh) | 图像处理系统及图像处理方法 | |
US20070150494A1 (en) | Method for transformation of an extensible markup language vocabulary to a generic document structure format | |
US9286272B2 (en) | Method for transformation of an extensible markup language vocabulary to a generic document structure format | |
US8416429B2 (en) | Methods and structure for substantially automated device capabilities file generation using XML schema | |
CN1771494A (zh) | 包括无分隔符的块的文本的自动分块 | |
CN109271613A (zh) | 一种pdf文件解析方法 | |
US20070192685A1 (en) | Document versioning based on layer content | |
CN1542648A (zh) | 用于词分析的系统和方法 | |
CN101833545A (zh) | 数字资源加工过程中的数据标引方法 | |
JP5430312B2 (ja) | データ処理装置、データ名生成方法及びコンピュータプログラム | |
JP2004363786A (ja) | 画像処理装置 | |
JP4811133B2 (ja) | 画像形成装置及び画像処理装置 | |
JPH05159101A (ja) | 文書論理構造認識および文書内容認識のための装置および方法 | |
CN1438589A (zh) | 文档信息处理方法,文档信息处理装置,通信系统和存储器产品 | |
CN1110939C (zh) | 具有打印控制的信息处理设备和方法 | |
US7589867B2 (en) | Image data flow producing system, method and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |