台湾的台风、地震灾害频繁,抢救灾害的同时,交通路网的通阻状况扮演相当重要之角色。 目前国内的交通路网通阻系统多半已与地理信息系统结合,利用网格格式或矢量格式的电子地图 作为系统展示底图,通阻资料的建置则有两种,一是人工数化方式 (使用者用肉眼判断所欲建置 之通阻点资料位置,以鼠标于荧幕上数化),另一是坐标定位方式 (取得通阻点的经纬度坐标或 TM 二度分带坐标)。前者主要缺点在于数化点位置不易准确,误差较大且耗费时间较长;后者主 要缺点则在于灾害发生时坐标资料不易取得。考量救灾时间急迫,本研究因应现有通阻资料多以 文字方式呈现 (如:交叉路口、著名地标、某道路几公里处等),设计建构一个以自然语言概念为 基础,具备判释文字信息并自动定位于路网功能之交通路网通阻信息系统。分析通阻描述信息的 文字结构,并归纳出几个主要的描述类别,再结合自然语言关键字对应法研发系统中各描述类别 之自动定位功能。以台北市文山区作为研究示范区,利用道路与地标图层进行空间定位分析,完 成系统主要功能:输入一段具备空间意涵的文字信息即可自动定位于电子地图上,并存成一笔新 的点资料,作为灾时决策之参考。 www.gispark.com
研究动机与目的
目前网络上已有许多通阻信息查询系统 (黎汉林 等,1999),其交通路网通阻点之定位是以人工判断方式 来数化,通常会产生资料点位置误差过大、资料点不在 道路在线等问题。除了人工判断之数化方式以外,获得 通阻点经纬度或 TM 二度分带系统之坐标信息虽可使其 定位更加准确,但其所耗费的人力与时间过多,不符合 灾害防救紧急处理之原则,且其往往难以获得,除非公 路阻断点在阻断原因发生时,当地恰有 GPS 定位系统之 仪器,但其可能性并不高。由于目前之道路路况通报仍 是以文字叙述为表达方式,并作表单式陈列供民众查 询,其描述道路上某空间位置的文字叙述已提供相当的 空间意涵,且目前已发展建置之道路空间图层相当完 善,若能因应通用的文字描述方式,研发自动判释系统 以确实定位于地图上,就可避免思考与地图比对过程所浪费之人力与时间,且误差减小,可作为公路管理单位进行抢修之参考。 考虑到抢救灾害时间急迫,本研究以快速便捷为系统发展之基础原则,以矢量格式 (vector) 图档为底图, 进一步将描述通阻点之文字透过字词拆解功能进入资料 库检索,由系统自动判断该描述信息所属之描述类别, 并依该类别所对应的系统定位功能自动定位于地图上, 并建置为一笔新的点资料,以取代通用之人工数化方式 与坐标转换方式。因此系统设计需考量各种通报方式 (空间位置表示法),研发自然语言解析技术,并因应发 展相对应的空间定位功能,供信息建置者 (公路管理单 位) 使用文字输入方式,更便于建置交通路网通阻状况 之点资料。 GIS公园www.gispark.com
自然语言在空间定位之应用 GIS公园www.gispark.com
让计算机能了解自然语言一直是人工智能的重要研究方向之一 (Brill and Mooney, 1997),1970 年代自然语言
在一些特定的领域有不错的成果,例如以英语回答有关 月球岩石的相关问题 (Woods, 1977),或是回答有关飞机 维修的问题等 (Waltz, 1978)。1980 年代此方面的研究持 续进展,但必须以人工加入语法及知识库,且只能在特 定的应用领域内应用 (Allen, 1987),且必须有大量的领 域专家参与建立语法与知识库,因此应用的进展相当缓 慢。为了解决此方面的问题,有研究者提出应用学习的 方法,让计算机学习大量的实例来建立知识库 (Garside,et al., 1987; Waibel and Lee, 1990; Ng and Lee, 1996),此方 面的研究成果,让语言自动辨识的能力有了相当大的进 展。
最简单的自然语言理解方法,也许要算是「关键字 对应法」,在一些特定的场合下是有效的。其方法简单归 纳起来是:在程序中规定对应和动作两种型态的样本, 然后建立一种由对应样本到动作样本的映射。当输入叙 述与对应样本相对应时,就去执行对应样本所规定的动 作,这样从外表看来似乎是计算机真正实现了能理解使用 者沟通的目的。 (林尧瑞等,1992)
内容来自GIS公园
本研究在数据库搜寻方面,使用自然语言技术中之「关键字对应法」与「观念转换函数」,利用数据库内容 撷取出关键字部分,再以关键字的前后顺序配合观念转 换函数判别其所代表的空间意涵,透过系统设计,将关 键字所代表的信息重组对应某一「对应样本 (Pattern) 」 后,进行路网上之空间定位。
一般而言,我们在描述空间上的一个点时,会依描 述者内心所构建的心像图、所看到的物体、思考逻辑与 表达方式而不同。在美国智能型运输系统标准需求工作 小组 (Public Sector ITS Datum Requirements Workshop) 所定之区 位 描述规范 (Location Reference Message Specification , LRMS) 提出 「区位描 述(Location Referencing)」概念,「区位描述」就是指「我们对物体 所在位置的认知」,当我们想要告诉别人某项地物在何处 时,我们可能会描述另一个一般人所熟知的地物位置, 再将其空间上的相对性叙述出来。这可以有很多种表示
方式,就称为「区位描述方法 (Location Referencing
Methods)」。我们所给的参考点可以是地球中心、街道交 叉口、或赤道与本初子午线的交叉点,也可以用一些参 考点的位置去描述目标物的位置,如:一条路、一个牧 场或一家购物中心。(Cecil, 1996)
我们所使用的参考物必须是人们普遍可以接受的, 象是坐标系统,每个地方所惯用的坐标系统可能不同, 如目前台湾所惯用的坐标系统是经纬度坐标系统与 TM 二度分带坐标系统;利用道路名称来描述时,也必须是 一般人认识的道路较佳。而台湾运输路网的空间位置描 述方式,可由路况报导资料中得知。目前路况报导一般 通报方式分为国道、省县道与市区道路三种,国道的表 示方式是「北上 (或南下) xx km」,省县道的表示方式则 是「xxx 线 xx K + xx」,市区道路的表示方式则有许多 种,如:「xx 路 xx 路口往 xx 约 xx 公尺处」、「(知名地 标) 附近」只是其中两种表示法。 内容来自GIS公园
在本研究中,主要研究对象是道路和地标图层,欲 建立的系统功能主要为「于路网资料上定位通阻点资 料」。通常点资料所采取的空间定位方法是利用「X, Y」 坐标或是「经纬度」、「TM 二度分带」等坐标系统加以 定位,而因坐标资料不易取得,可采取另一种利用相对 关系简化信息以取代坐标的路径测量方法来定位,如:
「XX 线 23 公里处」。在作道路资料线性分析的时候, ESRI 的 ARC/INFO 中就有提供这项功能,称为「动态 分段 (Dynamic segmentation)」功能。何谓「动态分段」? 意即在基本路网图建置完成后,为因应不同的课题,必 须有对既有路段作重新逻辑建构的能力,且为节省位相 关系的储存,各路段上的属性资料应能随主题图上路段 构建的不同而予以重新分配。例如:原有图层资料上有 许多路段,将所选之单一路段经重新建构后,分成 8 小 段,但此功能并不改变原来线资料的坐标,故连结于原 本线资料上的属性资料并不会因为重新分段而遗失。动 态分段不仅可依需求将线段重新分段,亦可避免各主题 需求可能造成的资料重复问题。如图 1,设定的路径测 量 (较粗的线段) 不必受限于符合原道路线段的起点与终点坐标,可自行加以定义。图 2 则表示透过动态路段 功能定义出起点终点坐标后,可计算出某一数字所代表 的位置,用来定位交通意外的区位。(ESRI, 1994)
www.gispark.com
目前国内的地址对位技术,一是记录每一个路段的 起讫门牌号码,配合内差法定位;另一是将每一户有门 牌的建物坐标记录成点资料,再建立各点资料所对应的 住址信息,其信息组成为县市、乡镇、村里、道路 (段)、 巷弄、号,将住址信息的纯文字档作为属性表结合点资 料的坐标之后,即成为具有属性资料的地址点资料。台 北市、台中市与高雄市均已建置了完整门牌地址对位系 统。
研究方法
copyright gispark.com
本研究之架构为:搜集通阻自然语言→整理归纳→ 建立拆解规则→定义空间定位方法→建立系统→测试→ 结论。 copyright gispark.com
(一) 搜集通阻自然语言 本文来GIS公园
本研究搜集 119 勤务中心与敦化无线电台的空间位 置描述信息并加以汇整分类,进一步统合路况报导、119 勤务中心报案资料及敦化无线电台的叫车资料后,依据 台湾的道路系统,将运输路网上空间位置描述方式区分 为国道、省县道与市区道路三大类,分述如下:
1. 国道:一般描述方式都是「xxx 北上 (或南下) xx km」,如:中山高南下 88 公里处。
2. 省县道:省道的一般描述方式都是「台 x 线 xx K (+ xx)」,如:台 3 线 30K+22。县道的描述方式则为「县 xx 线 xxK (+ xx)」,如:县 107 线 30K+22。
3. 市区道路:市区道路的描述方式有许多,一般常 用的参考点是道路交叉路口、重要地标、桥梁、著名地 点、门牌号码…等。而透过专人「引导」所表达出来的 主要是「地址」、「地标」与「路口」三项「元素」。 内容来自GIS公园
(二) 整理归纳以建立拆解规则 本研究将前述主要描述型态 (参考点 + 方向 + 距
离) 结合描述信息的三项「元素」,将三项「元素」各自
搭配组合,再考虑其各种组合之合理性 (会不会有这种 表示法?这种表示法人脑是否容易了解?),整理出除了 单纯的「地址」描述之外共有 11 种可能的组合,以自然 语言「关键字表示法」的对应样本型态列示如下:「XX 路 XX 路口」(无方向距离)
․「XX 路 XX 路口」往「标准方向」+「距离」
․「地标」旁「XX 路」上 (无方向距离)
․「地标」往「标准方向」+「距离」
․「地标」往「XX 路 XX 路口」+「距离」
․「地标」与「XX 路 XX 路口」中间
․「XX 路 XX 路口」往「地标」+「距离」
․「地标」往「地标」+「距离」
․「地标」与「地标」中间
․「XX 路 XX 路口」往「XX 路 XX 路口」+「距离」
․「XX 路 XX 路口」与「XX 路 XX 路口」中间 www.gispark.com
上述各种对应样本「」中所代表的就是「关键字」,
本研究研发之系统功能必须达到「只要输入之描述信息 吻合上述任一对应样本,系统即执行该对应样本所对应 的动作」之目标。在本研究中,关键字的抽取是依靠词 库的建立,因人们对同一事物可能有许多种表示法,故 本研究另行建立「语典」,以方便系统了解同义字。
建置系统前必须先搜集所需之空间图层—道路图
层、地标图层及地址资料,其首要条件为具备完整之属
性数据库,道路图层除了起迄坐标、长度外,必须有路 名信息;地标图层除了坐标外,应有地点或地标名称资 讯;地址资料必须具备坐标与完整的门牌号码。在词库 建立方面,则包括路名库、地标库、标准方向库、距离 单位库、中间字符串库等。故本研究之字词拆解重组流程 如下图 3 所示。
(三) 定义空间定位方法 本研究的系统空间定位主要分为三大部分:
1. 国道与省县道
利用网络分析之动态路段功能,即可将空间位置文 字描述信息所表达的空间意涵,经系统判断拆解有效字 串,于道路图层上进行空间定位。
2. 地址对位
地址对位将搜集得到的地址点图层资料利用查询属
性表之功能,可直接比对空间描述信息所拆解而得之有 效字符串,再于道路图层上进行空间定位。 GIS公园www.gispark.com
(四) 参考点+方向+距离 内容来自GIS公园
本研究主要重点--「参考点+方向+距离」描述类型 的定位方式,是利用各种词库的建立作为自然语言中「关 键字对应法」所需的数据库,词库建立后进行字符串拆解
重组,再将重组而得的空间位置信息比对所建置的 11
个描述类型,若吻合任一种描述类型,则透过图层资料 库与系统之程序设计执行该描述类型所对应的空间定位
(1) 「XX 路 XX 路口」 (无方向距离)
功能。现就 11 种描述类型于系统内之字符串重组与地图定
位部分简要说明如下 (图 4~10):
图 4 描述类型 1 定位示意图
(2) 「XX 路 XX 路口」往「标准方向」+「距离」
图 5 描述类型 2 定位示意图
(3) 「地标」旁「XX 路」上 (无方向距离)
图 6 描述类型 3 定位示意图
copyright gispark.com
(4) 「地标」往「标准方向」+「距离」 copyright gispark.com
图 7 描述类型 4 定位示意图 www.gispark.com
(5) 「地标」往「XX 路 XX 路口」+「距离」
(6) 「地标」与「XX 路 XX 路口」中间
(7) 「XX 路 XX 路口」往「地标」+「距离」
(8) 「地标」往「地标」+「距离」
(9) 「地标」与「地标」中间
图 8 描述类型 5、6、7 定位示意图
图 9 描述类型 8、9 定位示意图
(10) 「XX 路 XX 路口」往「XX 路 XX 路口」+「距离」
(11) 「XX 路 XX 路口」与「XX 路 XX 路口」中间
图 10 描述类型 10、11 定位示意图
图 11 系统架构图 GIS公园www.gispark.com
本系统采用 Visual Basic 及 Map Object 开发系统所 需功能,系统界面包含地图显示工具列、图层列表区、 地图显示区、描述资料输入区、输入资料钮及状态列。 本系统具备新增、编辑、删除灾害点之功能,直接于介 面上操作即可。 www.gispark.com
图 12 系统界面展示 GIS公园www.gispark.com
针对本研究归纳出之「十一种描述类型」进行系统 之定位测试,输入符合各项描述类型的描述文字,系统 皆可经过内部运算定位并显示于地图显示区中。为了确 认系统之实用性,本研究亦利用 119 勤务中心提供之本 研究范围内的描述信息 50 笔进行系统测试,其结果为
35 笔资料可自动定位于地图上。4 个描述问题在于使用 者所输入之描述信息不够充足或无法吻合系统设定之描 述规范,系统无法自动定位,关于另外 11 个资料问题, 则因资料缺乏,可藉图层编修来解决资料不足的问题。
图 13 编辑已有灾害点之画面
图 14 新增灾害点之画面
内容来自GIS公园
结论
www.gispark.com
考虑到通阻信息的呈现方式多半是已具有空间意涵 的文字描述资料,交通路网通阻信息之建置应配合容易 得到之文字描述信息,而非要求民众、工务局员工或是 任一通阻资料来源必须要有固定模式的资料,交通路网 通阻系统才能建置信息。故本研究结合自然语言技术与 地理信息系统,建置一个以台北市文山区为示范区的交 通路网通阻系统,自动拆解所输入之空间信息描述文 字,并将拆解而得之信息配合数据库加以搜寻,然后定 位于目标点。透过交通路网上空间位置描述资料的搜集 分析,本研究归纳出 11 种描述类型,并针对此 11 种描 述类型利用自然语言的关键字对应法建置一交通路网通 阻系统,只要符合这些类型的描述方式,即可自动定位 于路网图层上并建置为一笔新的点资料。关于地址对位 与国道之定位部分,依系统测试结果来看,已确定定位 功能确实可行;而一般道路部分,只要使用者所输入的 描述信息与 11 种描述类型符合的话,系统均可顺利定位 出来。进一步评估系统发展的困难时,发现主要的限制有 二:一是自然语言描述的范围太大,即使定出了几种范 本,也无法涵括全部的可能性;二是数据库永远没有足够的,必须一再地测试系统及增加资料,才能使定位成功率增加。
因为这 11 种描述类型为本研究者归纳所搜集得到 的信息辅以个人判断之方式所建置,所涵盖的范围毕竟 有限,而自然语言领域之广泛,虽已侷限至「交通路网 上空间位置描述」的范围,但必有本研究者无法归纳统 整之部分,故此成为本研究之最大限制。意即若使用者 所输入的描述信息跳脱了这 11 种描述类型,系统就无法 定位出来。关于这个部分,其应用的技术可能就不只是 自然语言的关键字对应法了。而在广大的自然语言领域 中,后续研究者可能必须找到更多应用的理论与技术, 以研发出更人工智能、更完整的定位系统,可进一步应 用在防救灾、无线电出租车、宅配通、119 勤务中心、 路况通报等方面。
引用文献
内容来自GIS公园
林尧瑞、马少平 (1992) 人工智能导论,台北:格致图 书公司。
黎汉林、李俊庆、林立中 (1999) 网际地理信息系统设 计与运用-A Design of Web GIS,台北:儒林。
Allen, J. F. (1987) Natural Language Understanding.,
Menlo Park, Calif.: Benjamin/Cummings.
Brill, E. and Mooney, R. J. (1997) An overview of empirical natural language processing, AI Magazine, Winter 1997, 13-23.
Cecil, W. H. G. (1996) Location Referencing for ITS, Oak
Ridge National Laboratory.
Cecil, W. H. G., David, S. and Stephen R. G. (1996) LocationReference Message Specification Preliminary Description, U. S. A: Federal Highway AdministrationOfficeofSafetyandTraffic Operations IVHS Research Division.
Environmental System Research Institute. (1994) Network
nalysis, U. S. A.: Environmental System Research
Institute. copyright gispark.com
aarside, R., Leech, G., and Sampson, G. (1987) The Computational Analysis of English: A Corpus-Based Approach., London: Longman.
Ng, H. T. and Lee, H. B. (1996) Integrating Multiple Knowledge Sources to Disambiguate Word Sense: An Exemplar-Based Approach. In Proceedings of the Thirty-Fourth Annual Meeting of the Association for Computational Linguistics, 40-47. Somerset, N. J.: Association for Computational Linguistics.
Waibel, A., and Lee, K. F. (eds.) (1990) Readings in Speech Recognition.SanFrancisco,Calif.:Morgan Kaufmann.
Waltz,D.L.(1978)AnEnglishlanguage question-answering system for a large relational database., Communications of the Association for Computing Machinery, 21 (7): 526-539.
Woods, W. A. (1977) Lunar rocks in natural English: explorations in natural language question answering, In Linguistic Structures Processing, ed. A. Zampoli, New York: Elsevier.
本文来GIS公园