提供WWW服务的JAFOV数据库

提供WWW服务的JAFOV数据库,第1张

K.Yamamoto

(Koka Women's College,38 Kadonocho,Nishikyogoku,Ukyo,Kyoto 571,Japan)

N.Nishiwaki

(Nara University,1500 Misasagicho,Nara 631,Japan)

摘要 JAFOV是一个描述日本脊椎动物化石标本的数据库,存储了大约4500个标本的有关数据。数据库于1982年建立在日本Kyoto大学数据处理中心的大型机上,并以联机形式提供对外服务。这个系统使用不方便且图像处理功能弱,因此我们试图运用WWW技术来解决这些问题。WWW提供非常美观、友好的用户界面,是一条在因特网上处理各种多媒体信息的有效途径。在本项研究中,我们使用WWW技术开发了一个基于因特网的新型JAFOV服务系统原型。经过试运行,我们认为建立的新系统对JAFOV这类数据库的改造是适合的。

关键词 数据库 化石 脊椎动物 标本 因特网 WWW DBMS

1 引言

JAFOV是日本脊椎动物化石标本数据库。它于1982年建成,记录了大约4500个标本的描述数据。数据库存放在日本Kyoto大学数据处理中心的大型机上,以联机数据库的形式提供对外服务。然而,数据库还存在一些问题,如不易使用、图像(标本的照片或草图)联机处理功能弱等。

在本项研究中,我们试着应用WWW技术使系统的使用更加容易并增强图像的联机处理能力。WWW提供非常美观、友好的用户界面,是一条在因特网上处理各种多媒体信息的有效途径。将它与DBMS连接,我们可以获得一个比当前使用的JAFOV联机数据库更好的服务系统。

在本项研究中,对要开发的目标系统有以下几点要求:

(1)数据检索可以通过WWW浏览器如Mosaic,Netscape等进行;

(2)能处理的数据不仅包括文档和数字,还应包括化石的图像;

(3)检索到的数据能直接在终端上显示、打印或下载到用户计算机上。

2 JAFOV简介

2.1 数据库内容

名字JAFOV来源于jApanese FOssil Vertebrate(日本脊椎动物化石)的缩写。它是一个由日本脊椎动物化石标本描述的数据组成的数据库。JAFOV数据库的内容包括化石标本的文档、数字和图像数据,见图1。不过到目前为止,只有文档数据已经入库,而由于某些原因(主要是技术上的),数据库还远没有实现。

图1 JAFOV数据库的原始设计

JAFOV使用一个称为FAIRS的DBMS层次模型。它专为富士通公司制造的大型计算机而设计。这个DBMS适合于文档数据库,如正在使用的JAFOV,它为那些作为查找关键词而经常使用的数据项生成一个倒排文件以加速查找过程。这个模型不适合于处理数字和图像数据。

JAFOV由41个数据项(表1)组成,内容包括标本的描述、地理位置、地质层位、保管人及其它有关信息等。它们被归类为8个组,即:名字、类属、产地、化石形成层位、地质年龄、化石区段、标本保管人和相关参考书目。其中一部分数据项被定义为查找键,其余除少量仅供输出外,均作为文本数据项进行查找。

表1 JAFOV数据库中的数据项

大部分数据项的值直接从原始数据输入,其余则通过使用字典和/或转换表从其它数据项获取值。如转换表中箭头所示,有一些数据项的值通过已有的转换表生成,还有一些则从父数据项中摘取生成。这些数据项的存在减少了数据输入工作量并大大降低了数据出错率。

2.2 数据库结构

JAFOV数据库由JAFOV工作组建立和维护,它是日本脊椎动物化石学家协会(AVPJ)下的一个志愿小组。

建立JAFOV数据库的过程如图2所示。原始数据由日本的古生物研究所(所)及博物馆的志愿者提供。他们填写有关他们标本的数据采集单并交给工作组。工作组检查数据单并把内容输入到计算机形成原始计算机数据,由计算机的数据转换程序自动把它转换成JAFOV需要的输入数据。在这个过程中,一些数据项的数据通过参照从代码表得到的字典文件被生成,另一些项的数据则从父数据项中摘取。随后以JAFOV的格式打印出数据列表,并送回给数据提供者作校验。如果需要,原始计算机数据还将根据数据提供者的规范要求进行校正。此后,JAFOV的输入数据准备完毕,DBMS根据其数据定义将输入数据送到JAFOV。到这个时候,数据库中建立了两个文件:数据文件和它的倒排文件。

图2 建立JAFOV数据库的过程

2.3 当前提供服务的方式

目前,JAFOV作为联机数据库已经运行于Kyoto大学数据处理中心的大型机上,提供服务的主要方式见图3。可以通过直接或间接(即通过其它计算中心)联接到中心的一台终端来使用数据库。几年前因特网尚未建成,对数据库的存取只能通过连接在大学计算机互联网络(NACSIS)上的计算中心进行,而且还要对用户进行验证和收费。

图3 当前JAFOV提供服务的方式

图4显示的是目前JAFOV的使用方法。用户使用telnet将终端直接或通过前面提及的其它计算中心间接地连接到Kyoto大学数据处理中心的主计算机上,以telnet方式登录计算机,然后使用图中所示命令交互式地查询他需要的数据。

3 WWW版本的JAFOV

3.1 需要改进的地方及解决方法

现行的JAFOV系统有许多有待改进的问题,尤其是其服务方式。系统的使用应该更加容易、更加广泛,并且还应提供除文档处理以外的数据处理能力。存在的主要问题包括:

(1)不友好的用户界面:现在的用户界面是命令行方式(如图4),对研究人员很不方便;

图4 当前JAFOV的使用方式

(2)服务受限制:使用JAFOV之前需要注册到NACSIS的某一计算中心,也就是说只有注册的用户才能使用数据库;

(3)建立和维护多媒体数据库困难;

(4)在大型机上建立和维护JAFOV成本太高。

而WWW技术为这些问题提供了很好的解决方案:

(1)可以使用WWW浏览器漂亮、友好的图形用户界面;

(2)通过因特网进行二进制数据变换很方便;

(3)提供很好的图像文件显示;

(4)通过因特网可以实现更广范围的存取。

为此,我们试着开发了JAFOV的一个WWW版本,其规范要求和功能在下文描述。

图5 JAFOV的WWW服务简图

3.2 JAFOV的WWW服务概貌

JAFOV的WWW服务框架见图5。当用户使用WWW浏览器通过因特网访问到服务器时,JAFOV的首页(图6)显示在其计算机上。用户在该页上输入搜索条件并提交页面,然后与条件匹配的记录/标本被检索出来,并将其登记号以可点击按钮(图7)的形式显示在客户计算机上。用鼠标单击任一登记号,可以显示该记录的内容,见图8。

图6 JAFOV的WWW服务首页

图7 查询JAFOV得到的结果记录列表

图8 记录的内容

上例显示的查找过程与图4所示例子相同。毫无疑问,这里显示的方法比当前正在使用的方法对用户要友好得多。

3.3 WWW版JAFOV的DBMS

在本项研究中,我们开发了一个原始DBMS,并以此建立了WWW版JAFOV的一个原始数据库。WWW版JAFOV的结构见图9,它由两类文件组成,即主文件和附加文件。主文件包含文档数据和图像数据文件名。篇幅长的文档数据如参考文献也可以文件形式单独存储,而在主文件中只存储相应的文件名。虽然这类数据不能被检索,但可以使查询时间更短。图像数据是作为附加文件存储的。

图9 WWW版JAFOV数据库的结构

主文件是一个文本型简单文件,其中定义了数据项/域。它由“项/域定义记录”和“标本数据记录”组成。项/域定义记录以CSV(即以逗号分隔的变量)的形式置于文件的第一个记录。接下去是与项/域定义记录有相同格式和顺序的标本数据记录。一个标本使用一个记录。文件可以由任意一种文本编辑器生成。

在检索生成的页面中,图像和文本文件以超文本形式连接起来。页面中嵌入了一个标志,它连接到图像或文本文件。当点取该标志时可以显示与之连接的图像或长文本数据。标志在页面上以可点取的按钮形式显示。

3.4 系统的查找过程

一般说来,WWW服务中的数据检索通过公共网关接口(CGI)来处理,如图10。通过使用HTML的表功能生成的页面显示在客户计算机的WWW浏览器上。当用户在页面中输入搜索条件并按“发送”按钮后,条件通过CGI接口送到DBMS,数据搜索开始。检索到的数据以HTML文件的格式送回客户端并显示在客户计算机上。

图10 通过WWW进行信息检索的通用机制

图11显示的是我们开发的系统中数据库检索及结果显示的机理。系统基本上使用CGI接口。首先,用户输入的条件通过CGI送到数据检索模块。模块在数据主文件中查找数据,并生成一个临时文件和一个HTML文件,检索到的记录在HTML文件中以可点取按钮(图7)的形式列出来。检索中可以使用多个查找条件,但条件之间只能是“与”的关系。

然后服务器把模块生成的HTML文件送回客户端。用户可以用鼠标单击记录以显示查到的详细资料。当单击任一标本登记号时,信息也是通过CGI送到显示模块。模块使用选定的文件生成HTML格式的显示页面,并将它送回客户端。于是,与记录有关的图像就通过相应的文件名连接到页面上。

图6~8是执行检索的一个例子。图6是用户输入查询条件的页面,即首页。图7是输入条件为“‘名字’中包含‘NAUMANNI’”时获得的查询结果。查询得到了两个标本并显示为图中可点取的按钮。这一页通过图11中的数据查询模块生成。同时,检索到的数据其全部内容保存在图11中的选定数据文件中。图8是单击图7中按钮后显示的记录内容。这一页通过图11中的显示模块生成,它从选定文件中检索出数据并使用一个模板来生成本页。

4 结论

在本项研究中,我们通过使用WWW技术开发了一个基于因特网的原型系统,很好地改进了JAFOV数据库和其提供服务的方式。改进的方面包括:

(1)显著改善了用户界面,用户对系统的使用更加方便;

(2)使用数据库的范围变得更为广泛,因为WWW服务不需要预先注册,所有能连接到因特网上的客户都能使用;

(3)数据库可以像处理文本数据那样方便地处理图像数据。

这些改进很好地解决了JAFOV当前版本中存在的大部分问题。

然而,要使这个系统在因特网上实际运行,还有一些问题需要解决,这些问题主要包括:

(1)查询数据需要的时间偏长;

数学地质和地质信息

(2)本项研究中开发的DBMS可以达到的实际容量是1000个记录,当存储记录数超过该数目时,数据查询将花费更长的时间。

通过使用功能更强大的DBMS如RDBMS作为搜索引擎,这些问题可以得到解决。因此,我们正在使用RDBMS来开发实用型系统。

致谢 笔者衷心感谢Toyo信息系统有限公司的Shintaro Inoue先生,他参与了本系统的开发,还要感谢CSK有限公司的Koushiro Miyauchi先生,他对本项研究中使用的计算机作了软硬件配置与调试。(龚仁辉译,陈建平校)

参考文献

[1]T.Kamei,K.Yamamoto,and N.Nishiwaki.Database on Fossil Vertebrate Specimens Deposited in Japan:JAFOV.Bull.Data Proc.Cent.,Kyoto Univ.,1986,19(4):260~268(in Japanese).

[2]N.Nishiwaki.Database on Fossil Specimens Deposited in Japan.Proc.3rd Intern.Conf.Geosci.Inf.orm.(Adelaide,Australia).Australian Mineral Foundation,1986,1:62~70.

[3]N.Nishiwaki,K.Yamamoto,and T.Kamei.Data Base on the Japanese Fossil Vertebrates.P.S.Glaeser(Ed.)Data for Science and Technology.Proc.8th Intern.CODATA Conf.(Jachranka,Poland),North-Holland Pub.Co.,1982,75~80.

[4]K.Yamamoto,N.Nishiwaki,and T.Kamei.JAFOV:Data Base on the Japanese Fossil Vertebrates(1).Geol.Data Proe.,1982,7:21~30(in Japanese).

[5]K.Yamamoto,N.Nishiwaki,and T.Kamei.Present Status and Future Extension of JAFOV:Database on the Japanese Fossil Vertebrates.Geol.Data Proc.,1987,12:142~150(in Japanese).

[6]K.Yamamoto,N.Nishiwaki,and Y.Kawamura.An Extension of the Japanese Fossil Vertebrates Database JAFOV.Bull.Data Proc.Center,Kyoto Univ.,1994,27(3):117~120(in Japanese).

[7]H.Horiike,Y.Ozawa,Y.Murao,and T.Watanabe.User's Manual:Database Retrieval with FAIRS.Data Proc.Cent.,Kyoto Univ,1984(in Japanese).

[8]L.Aranson.HTML Manual of Style.Ziff-Davis Press,Emeryville,California,1994.

大数据

大数据技术(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。(在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中[2] 大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据的方法)大数据的4V特点:Volume(大量)、Velocity(高速)、Variety(多样)、value(价值)

大数据服务器

一台或多台计算机和数据库管理系统软件共同构成了数据库服务器,数据库服务器为客户应用提供服务,这些服务是查询、更新、事务管理、索引、高速缓存、查询优化、安全及多用户存取控制等

小南国永生花

1、简图没有办法发上来,就给你说说怎么做好了。

2、2台服务器分别装电信,网通光纤还是宽带!

3、交换机N个能接完50台电脑就行,电信路由一个,网通路由一个。

4、其中2台服务器各接一个交换机,也就是说,服1接一交换机,服2接一交换机,但是这两个交换机要全部接入连接50台电脑的网络。

5、简化一下就是:服1接猫,猫接路由,路由接交换机,服2同服一。

交换机N个和50台电脑连接,担是要留下两个接口分别接服1和服2

OK


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/578031.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-07-05
下一篇2023-07-05

发表评论

登录后才能评论

评论列表(0条)

    保存