一、北京市地理编码数据库的研究(论文文献综述)
顾海硕[1](2021)在《基于时空异构信息网的盗窃犯罪防控系统》文中研究表明犯罪时空预测作为预测警务的核心支撑技术,自2000年左右至今得到了快速的发展,但现有工作仍存在数据治理体系不清晰,模型融合能力及泛化能力不强的问题。本文对犯罪时空预测做了如下工作:(1)总结了犯罪时空预测的实践背景和理论基础,将犯罪时空预测解构为利用历史案件的时空位置、时空环境和个体行为等要素,结合相应的算法模型预测未来案件时空分布的过程,并从输入要素的视角对当前的犯罪时空预测方法进行了总结和归纳,将其划分为基于案件时空位置信息的犯罪时空预测、基于时空环境要素的犯罪时空预测,以及融合行为轨迹和时空环境要素的犯罪时空预测等三种类型;(2)以北京市作为实证研究对象,基于POI/AOI、街区形态、商圈/生活圈、街景、路网等六大类350余万条时空环境数据构建了环境异构信息网,依据路网结构尺度将数据划分为宏观时空变量和微观认知变量,对不同的变量分别使用人工经验模型和基于深度学习的表示学习模型等方法进行了特征抽取,最后结合北京市2014、2017年的盗窃类案事件数据进行特征融合获得原生犯罪风险值,完成了时空背景认知变量的建模;(3)基于案事件时空位置信息、犯罪前科人员落脚点及其关联的案事件等主体行为数据构建了前科人员社会关系异构信息网,并分别使用人工经验模型和基于深度学习的表示学习模型对数据进行了特征抽取,最后结合原生犯罪风险值基于犯罪出行模型获取了犯罪主体出行概率、主体关系特征、时变犯罪风险值等盗窃犯罪时空预测模型中的时空风险感知变量;(4)最后,根据犯罪模式理论中的犯罪时空热点转移规律,结合深度学习CTR模型以及集成学习中的提升法分别进行了犯罪时空预测和纠偏,其中入室盗窃预测的AUC值最好可达79.72%,扒窃为78.41%,入室盗窃纠偏后的AUC值最好可以达到81.14%,扒窃为82.16%。相对于仅考虑案事件时空位置信息的时空图神经网络模型有了较大的提高。随后,对输入的特征组合进行了可解释性分析,生成了时空风险地图,并以此为基础设计实现了智能警务巡控原型系统。本文认为,犯罪时空预测未来需要从数据角度重点解决输入数据的体系融合、粒度细化和新型数据融合等问题,从模型优化方向应着重提高多源异构数据融合能力,平衡模型的可解释性与预测效果。
张昊[2](2021)在《基于Hadoop的轨迹大数据模型及可视化方法研究》文中认为轨迹大数据蕴含着丰富的时空信息,是具有位置、时间信息的采样序列,蕴含了被采集对象的时空动态性。与大数据的传统4V特征相比,轨迹大数据还具有更多特征:Veracity(真假共存),轨迹大数据普遍存在数据缺失、噪音点、冗余等异常;Visualization(可视化),轨迹大数据常需要与数据的实际空间位置、空间信息等结合,充分利用地图对运行状态、城市路网特性等进行可视化展现。近年来,随着卫星定位技术、LBS技术以及互联网的不断发展,位置数据被以各种方式收集,轨迹大数据呈爆发式增长,每天的任意时刻都在产生体量超大的轨迹数据,也就导致常规数据库不能更好的适应容量在实时扩张的轨迹大数据,同时轨迹大数据具有多源、数据结构复杂等特征,研究一种适用于轨迹大数据的存储管理技术已经成为现阶段研究的重点与难点。可视化是一种数据表达方式,常用于数据分析与数据挖掘工作,由于轨迹大数据的数据体量较大,在对其进行可视化时常遇到可视化成图耗时较长,页面卡顿,交通热点区域数据密度大,热力图可视化效果较差,呈现热核现象,可视化效果一般等问题。本文以北京市多源交通大数据为基础,通过搭建Hadoop分布式平台进行交通大数据的计算与存储工作,通过对轨迹大数据进行聚类、添加Geohash编码等方式改进轨迹大数据可视化问题,并建立基于Web GIS的可视化系统进行数据可视化测试。本文主要研究内容包括以下几个方面:(1)搭建Hadoop分布式存储框架。使用实验室电脑搭建微型分布式集群,对所研究数据进行预处理工作,实现出租车轨迹挖掘与各区域分时段的OD信息统计,最终结果结合前端web开源地图库进行可视化展示;(2)构建出租车轨迹数据模型。基于HBase建立轨迹数据存储模型,针对于出租车轨迹数据可视化问题,提出使用聚类方法处理原始出租车轨迹大数据,减少可视化绘制计算量和数据传输量;对原始出租车轨迹数据添加Geohash编码,提升小区域内轨迹数据的查询效率。经过对某一时间切片的出租车轨迹数据进行实验,对比发现热力图在缩放等级较高时加载效率提升约30%,基于Geohash编码的散点查询在高缩放等级下查询速度提升较为明显,验证了该方案的可行性;(3)构建电子地图存储模型。通过搭建HBase分布数列式存储数据仓库,结合电子地图数据与HBase列族存储特性,构建服务web可视化的电子地图存储模型,提高了地图栅格数据的加载效率,地图数据在完成100次查询对比后发现,查询效率提升约20%,并具有较稳定的实时加载速率;(4)搭建交通大数据可视化平台。基于上述研究与数据基础,设计交通大数据可视化平台的系统框架与各个数据的查询、可视化流程。通过Java后台代码实现对Hadoop框架的操作与数据传输,结合Java的SSM框架(Spring+Spring MVC+My Batis)完成服务端与前端web页面的数据传输与访问,前端使用开源Java Script地图引擎展示各类交通大数据的空间位置信息,结合echarts、d3.js等图表库可视化展示数据的基本信息。
张航[3](2021)在《基于BERT预训练模型的中文地址解析和匹配方法研究》文中研究指明地址作为社会发展过程中不可或缺的地理空间数据资源和战略性基础信息资源,已经成为智慧城市时空基础框架的重要组成部分,也是社会大数据组织、关联与共享应用的桥梁。地址匹配是将自然语言描述的地址数据,在地址模型或者编码规范的基础上通过智能化的地址解析,将解析结果与地址数据库中已有的数据进行比对,从而建立地址描述信息与空间坐标转换的过程。随着位置服务技术的广泛应用,积累了大量的地址数据,其中包含的地址要素类型及其组合方式更加复杂多样。当前,中文地址的管理和使用还处于较为初级的阶段,地址服务水平远不能满足社会各个行业的应用需求,因此必须深入挖掘中文地址的描述规律,实现中文地址的智能解析和高效匹配,才能更好的应对大数据时代下城市快速发展带来的严峻挑战。本文从中文地址的特征出发,构建了地址要素分类体系,分析了地址要素的组合规律,探索了预训练模型在地址解析上的应用,提出了基于地址要素索引的地址匹配方法。主要研究内容与成果包括以下几个方面:(1)中文地址要素分类与组合模式分析综合考虑我国不同地域民族文化和城市发展的差异,系统分析了中文地址的现状和特征。在借鉴国家地址标准和行业标准的基础上,完善了中文地址的要素分类体系。通过分析中文地址的结构特征,将中文地址的空间关系归纳为拓扑关系、方向关系和距离关系。分析了不同空间关系在地址中的表达方式,并总结了地址中常见的空间关系词汇。在此基础上,构建了地址中不同要素的组合模式,为研究地址解析和地址匹配奠定了基础。通过实验分析了地址要素的使用频次和地址要素的组合模式,对掌握地址要素组合变化规律以及中文地址的标准化管理和应用有着重要意义。(2)基于BERT预训练模型的中文地址解析模型针对中文地址结构化解析困难,采用BERT预训练模型作为地址语义的输入,结合双向LSTM作为特征抽取,利用CRF模型综合上下文特征,构建了基于BERTBi LSTM-CRF的地址解析模型,提升了中文地址的解析精度。依据中文地址要素分类与组合模式,构建了中文地址的标注规范。针对标注地址数据需要耗费大量的时间和精力,研究了中文地址标注数据的增强方法,减轻了人工标注的成本。(3)基于中文地址要素索引的地址匹配方法基于地址匹配服务的实际需求,确定了中文地址匹配的流程,制定了不同类型地址要素的匹配策略。针对现有地址匹配方法灵活性差、效率不够、要素容易混淆等问题,提出了基于地址要素的索引构建方法,提升了中文地址数据的组织效率和匹配性能。通过加权的地址要素相似度计算与地址语义相似度计算融合,构建了地址相似度计算模型,提高了地址匹配的准确率。构建了地址匹配评估方法,并通过实验证明了本文地址匹配方法有着较高的匹配性能和匹配精度。研究表明,在中文地址要素分类和组合模式中,构建的多层次地址要素分类体系和地址要素组合模式,对掌握地址组合变化规律以及中文地址的标准化管理和应用有着重要意义。在地址解析中,预训练模型、深度学习模型和统计学习模型的结合,可以提高地址解析的准确率。扩展的BIOES标注方法可以有效提高地址标注的效率,更容易被深度学习模型使用。地址匹配任务中,兼顾地址要素字符信息和语义信息的地址相似度计算有着更优的匹配效果。基于地址要素语义的索引比单纯的字符索引有好的匹配性能和精度。
林夏[4](2020)在《DRG支付制度下三级公立医院主诊医师绩效评价及提升策略研究》文中认为【目的】本研究在我国DRG支付制度改革的大背景下,构建三级公立医院主诊医师绩效评价模型并研发一套具有较强应用价值的绩效评价工具,系统的梳理三级公立医院主诊医师绩效评价影响因素并分析影响因素的层级关系、作用路径以及核心因素等,以期为我国DRG支付制度改革进程中三级公立医院绩效管理研究与实践提供理论支撑,提高医疗质量、保障患者安全,同时为三级公立医院进一步提升医疗服务效率、提高精细化管理水平提供有益参考。【方法】(1)文献分析法。通过检索相关文献对医师绩效评价的理论、概念、方法、对象分类、指标体系、模型构建等内容进行总结、为后续的的研究设计提供依据。通过文献计量学方法对医师绩效评价相关研究进可视化分析。(2)二手数据收集法。提取北京3家(93个)、沈阳2家(36个)、济南2家(40个)三级公立医院骨科和心内科主诊组主诊医师绩效相关数据。a.半结构化访谈。选取DRG支付制度改革三个试点城市北京2家、沈阳2家、楚雄2家共6家医院,每家医院选择一定数量的临床医生和管理者,以及国家卫生健康委医管中心、国家DRG质控中心、云南省DRG专业委员会相关管理者共30人进行半结构化访谈。(3)专家咨询法。研究成立了由国家卫生健康委医管中心相关专家、高校相关领域研究者、三级公立医院管理者、主诊医师在内的专家小组,共20人,承担了本研究全部流程的专家咨询工作,并通过层次分析等对指标进行降维和确定权重。(4)数据分析法。采用决策试验和评价实验室法和解释结构模型,邀请专家组6名专家对26个影响因素作用矩阵进行打分,通过matlab进行矩阵计算,构建影响因素递阶结构模型。对北京3家(93个)、沈阳2家(36个)、济南2家(40个)三级公立医院骨科和心内科主诊组主诊医师绩效相关数据,采用决策树的方法进行实证分析。【结果】1.DRG支付制度下三级公立医院主诊医师绩效评价理论模型构建(1)DRG支付制度下我国三级公立医院的发展战略为:坚持政府办医的公益性,坚持以患者为中心的服务理念,主要提供医疗急危重症、疑难杂症的诊疗及服务,重点发挥在医学科学、技术创新和人才培养等方面的引领作用。逐步落实三个转变,即“在发展方式上,从规模扩张型向质量效益型转变;在管理模式上,从粗放管理向精细管理转变;在投资方向上,从投资医院发展建设向扩大分配转变”。(2)三级公立医院主诊医师绩效评价的关键问题分析结论为,三级公立医院主诊医师绩效评价应以医疗质量为基础,评价内容应充分结合主诊医师岗位职责及特点,同时绩效评价应纳入基于DRG的绩效评价指标。(3)以上述研究结论为导向,研究明确了财务、外部业务、内部客户、学习成长四个维度的具体绩效目标。同时对绩效评价指标以及评价结构的应用分析,最终构建我国三级公立医院主诊医师绩效评价的理论框架。2.DRG支付制度下三级公立医院主诊医师绩效评价工具的研发(1)DRG支付制度下医师绩效评价的特点为:一是应加强医疗质量监督力度,提高非预期死亡(低风险组死亡率)指标的权重等。二是为防止不收重患的情况发生,可将DRG入组率纳入评价指标。三是为了防止分解住院提高给付,可提高非计划性30天再入院率的指标评价权重。四是重点病历病案首页填写的准确率、疾病入组错误率纳入绩效评价指标。五是通过提高临床路径的入径率、出径率和变异率等指标的权重提高临床路径的管理水平。六是纳入基于DRG的绩效评价指标。七是加强对医患关系的关注力度。(2)三级公立医院主诊医师的绩效评价指标体系共包括7个一级指标(1.医疗费用、2.满意度、3,医疗质量、4.医疗效率、5.业务能力、6.管理能力、7.科研与带教)、13个二级指标(1.费用消耗指数、2.患者满意度、3.低风险组死亡率、4.非计划30天再入院率、5.甲级病案率、6.时间消耗指数、7.CMI、8.DRG组数、9.新技术使用及推广、10.主诊组的管理情况、11.文章发表、12.申请课题、13、带教情况)。指标的整体Cronbachα系数值为0.856,S-CV/Ave=0.96,KMO检验值为0.687,指标的信度、效度均较好。3.三级公立医院主诊医师绩效影响因素分析(1)研究从个医疗技术人才培养、环境、个人特质三个层面提取出从宏观到微观共26个绩效影响因素,构建了三级公立医院主诊医师绩效影响因素建框架模型。(2)区域经济、地理位置和医保支付制度是我国三级公立医院主诊医师绩效影响因素体系中作用最大,也是其他影响因素发生变化的最主要原因。最容易受其他因素影响的因素分别为工作满意度,其次是工作压力和收入水平,这三项因素同时也是中心度得分最高的因素。影响因素的层次为,第1层:主诊组的结构、工作满意度、工作压力;第2层:主诊组的设置模式、身体健康、心理健康:第3层:学历教育、毕业后教育、继续教育、医疗卫生资源、医院规模结构、医院战略和文化、医院收入和支出结构、医院的绩效和薪酬制度、科室的规模结构、医师职业精神、知识结构、家庭支持、收入水平;第4层:区域人口、医保支付制度、科室的类别、性别、年龄。第5层:地理位置、区域经济。(3)通过决策树模型进行实证分析,样本数据正确拟合的准确率达到93.12%,拟合效果较好。对主诊医师绩效影响的最关键因素分别是区域经济,其次为医师的收入水平,再次为年龄、工作满意度、工作压力。同时、医院的发展战略、医院的绩效制度、主诊组的管理模式、主诊组的人员结构等,均对医师的绩效结果产生了一定程度的影响。【结论】1.研究构建DRG支付制度下三级公立医院主诊医师绩效理论模型,模型以DRG支付制度下我国三级公立医院发展战略为导向,对绩效评价的关键问题、四维度的具体绩效目标、绩效评价的原则、应用等绩效评价全流程的相关内容进行了分析,对于后续评价工具的开发以及影响因素的分析具有较强的指导性,对我国三级公立医院绩效管理具有一定的参考价值。2.通过系统的文献综述以及DRG支付制度改革对医师绩效评价指标的影响分析,本研究开发了绩效评价工具。该工具具有较好的信度、效度,相较于传统的医师绩效评价工具,更加适用于我国DRG支付制度改革的大环境,使用的评价主体也更加具有针对性。3.三级公立医院主诊医师绩效影响较为关键和重要的因素包括区域经济、地理位置、医师收入水平、工作满意度、工作压力和年龄。同时医院的发展战略、医院的绩效制度、主诊组的管理模式、主诊组的人员结构等,均对医师的绩效结果产生了一定程度的影响。【创新与不足】1.研究创新(1)DRG支付制度下三级公立医院主诊医师绩效评价模型模型以DRG支付制度改革为背景,三级公立医院发展战略为导向,大健康理念下三级公立医院主诊医师的新要求为基础,紧随医改进程和时代发展、较为符合我国医院管理实际情况,具有较强的前瞻性和创新性。(2)DRG支付制度下三级公立医院主诊医师绩效评价工具评价工具针对我国三级公立医院以疑难复杂疾病的诊疗为主的功能定位,提高了的CMI以及医疗质量的指标权重;针对DRG支付制度下医师绩效评价的特点,指标纳入了非计划30天再入院率,甲级病案率和新技术的使用和推广情况。针对主诊医师岗位职责及要求,指标纳入了主诊组的管理情况,科研和带教等指标。该评价工具与以往的研究相比,评价方向更加明确、重点更加突出、主体更加聚焦,指标的选取更加具有针对性和实效性,具有较强的实践应用价值。(3)绩效影响因素分析本研究构建了包含了从区域经济等宏观因素到个人特质等微观因素在内的影响影响因素理论框架,从不同的层次和角度分析了三级公立医院主诊医师绩效影响因素,相较于国内外的相关研究,更加的系统、全面以及符合我国国情。将机器学习的方法引入主诊医师绩效影响因素的实证研究,相较于结构方程模型等传统的统计方法,决策树对于数据的分布以及样本量的的限制较少,分析结论更加精确,也同样具有较强的层次性。2.研究不足(1)指标体系内绝大部分为结果指标,过程指标较少,对于医生诊疗行为的评价力度较弱。(2)在基于决策树的绩效影响因素实证分析中,研究采用了方便抽样法,抽取了北京、沈阳、济南。但是三个城市均位于北方地区,可能存在一定程度的数据偏倚。
李佳[5](2020)在《基于地理编码的农村教育资源可达性研究 ——以株洲县为例》文中指出学校作为教育资源的载体和开展教育活动的场所,其空间布局影响着基础教育资源配置的公平性与合理性。学校的空间布局受到学生空间分布以及交通状况等因素的影响。农村地区人口分散,经济落后,交通欠发达,致使某些地区的学生就学距离过远,教育资源分布不均衡的现象尤为显着。再加上近些年城市化进程导致农村人口变化剧烈,农村学校存在粗暴撤并现象,使得农村小学合理布局成为农村教育发展的一项重大挑战。农村学生人口的空间分布和就学距离,以及教育资源空间分布的现状分析与评价是农村学校合理和科学布局的基础,可以为教育部门进行资源空间布局和优化配置工作提供支撑。本文提出一种利用地址信息字符串获取学生空间坐标的方法,并结合农村路网数据与学校坐标数据从三个方面分析教育资源空间可达性情况。从教育资源获取难度方面分析学生的入学距离成本,从教育资源供需规模方面分析学校服务范围和范围内教育资源的配置情况,以及结合入学距离与供需规模利用两步移动搜索法分析教育资源的空间可达性,并在此基础上探索教育资源空间布局中存在的问题并分析产生的原因。本文选择株洲县作为农村地区教育资源空间可达性的研究对象,利用地址匹配和地理编码技术将文本形式的学生家庭住址转换为空间坐标,以此获得学生空间分布数据。结合学生分布数据,学校分布数据与路网数据利用网络分析方法统计学生家庭住址到学校的最短路径距离,在此基础上进行矩阵运算获取学生的实际入学距离以及就近入学距离。利用规则密集点集结合网络分析技术为学校划分服务区并统计服务范围内教育资源配置情况。最后利用高斯两步移动搜索法计算研究区的教育资源空间可达性。研究获得结论如下:1,利用地址匹配技术加地理编码服务能够有效的获取学生家庭地址的空间坐标。2,研究区就近入学情况较好但是由多种原因引起的非就近入学现象使得学生实际入学距离成本较高,其中学校之间教育质量不均衡是主要原因。3,教育资源配置情况受学校服务区范围影响较大,实际情况下为学校划分服务区需要综合考虑多方要素结合多种方法。4,距离是制约研究区教育资源可达性的主要因素,以2000米为服务半径时研究区教育资源空间可达性情况较差,全区可达性达标人数仅占50.10%。服务半径为5000米时可达性普遍较好,可达性达标人数占比达到85.9%。
刘新国[6](2020)在《舆情视角下外语教育政策回应性探究 ——基于高考英语政策变迁的经验研究》文中研究表明改革开放以来,我国的外语教育政策为实现国家现代化和推进国际化进程做出重要贡献。回顾我国的外语教育规划过程,尽管以自上而下的规划路径为主导,但社会调查和征求民意也是其中重要的规划活动;同时,外语教育规划也激发国人对外语教育的复杂的情感。然而,当前的研究很少探讨外语教育政策应如何回应公众意见和感受,提高公众的满意度。随着互联网和新媒体的发展,公民的话语空间发生改变,公众意见表达异常活跃,社会舆情成为公共政策的重要影响因素。因此,本研究以舆情为研究视角,探索外语教育政策的回应性。高考英语是我国重大的外语教育政策,外语教育规划与高考英语政策变迁息息相关。本研究以高考英语的政策变迁为主线,并选取其中四个关键节点为经验案例,探究高考英语舆情与政策回应性的关系。本研究分析认为,政策回应性受制于制度语境、外部环境和由公众意见与媒介话语构成的社会舆情。为探究舆情与政策回应性的一般关系,本研究提出三个具体研究问题:(1)高考英语舆情特征如何?(2)高考英语舆情与政策回应性关系如何?(3)舆情与政策回应性关系的影响因素有哪些?本研究在理论视角上,借鉴政治学、公共政策学、新闻传播学相关的舆情-政策关系分析理论,以话语制度主义作为一种综合的理论视角审视高考外语政策变迁过程,构建出政策回应性的分析框架。在研究方法上,本研究以质性研究为主,融合量化分析方法对三种来源数据进行分析:(1)政策文本、历史研究文献和智库研究报告;(2)慧科新闻数据库和中国期刊网;(3)新浪微博,其中数据采用第三方爬虫软件采集获得。在研究路径上从总体和特定节点两个方面探究外语教育政策回应性。论文共分七章。前三章阐述了研究现状和基础概念与理论,论文第四章从总体上考察了高考英语政策变迁的制度文化语境。高考英语政策主要体现在科目地位、命题方式、考试内容和方式等方面。改革开放以来的高考英语政策变迁可分为三个阶段,即稳定上升期、调整变化期和巩固发展期,政策的变化可视为对外部政治经济文化条件和社会舆情的积极回应。论文第五章分析了高考英语舆情的总体特征。本章从报纸媒体、社交媒体和学术期刊三种媒体描述高考英语舆情的时空分布特征、舆情主题和热点事件。舆情分析表明,在高考英语政策调整变化时期,公众舆论对待英语的态度比较复杂,一方面认可英语作为国际化和现代化的工具性特征,另一方面要求弱化高考英语的科目地位、减少高考英语考试的社会功能比较强烈。新一轮高考改革启动以来,社会舆论聚焦在一年两考和中外文化冲突方面,容易引发成社会热点事件。高考英语听力是最为频繁的高考突发性事件,地方政策回应方式不一,但随着新高考改革的推进,回应的重点是加强考试管理,稳妥推进高考英语听说考试。接下来的论文第六章通过高考英语政策变迁的关键节点的探究高考英语舆情与政策回应性的关系。研究表明,尽管1999年以来国家高考制度改革政策突出高考内容和形式的改革,但是公众舆论的焦点在科目分值、计分方式和考试方式上。1984年第一次高考改革后高考英语确立了和语文、数学同等的统考科目地位和分值权重,并在实际中得到强化。新世纪以来公众对英语热开始反思,弱化英语的呼声比较强烈,2006年江苏省通过对民意的积极回应和协商,首次降低了高考英语分值。2013年北京高考改革迎合社会舆论,提出降低高考英语分值的方案,但是公众意见中专业话语发挥了重要影响,维持了高考英语地位。2017年以来为克服一考定终身的弊端,新高考改革试点省份高考英语“一年两考”,虽然降低了高考英语听力事故的风险,但是测试技术的要求和地方政府的政策执行能力成为“一年两考”的制约因素。论文第七章为启示和结论部分,将舆情的政策回应总结为四种模式,即主动咨询型、积极协商型、消极协商型和压力回应型,从三个方面提出回应性外语教育政策发展的可能路径,即正确认识观念性冲突、合理运用舆情调查、做好舆论环境建设。本论文的研究创新主要体现在理论基础、研究方法和研究应用三个方面:首先在理论基础上,以多学科知识为基础建构外语教育政策回应性的理论内涵,为外语教育规划探索符合现代治理理念的科学路径;其次是在研究方法上的创新,将质性探究与媒介框架分析和政策叙事相结合,拓展了质性研究的内涵;最后是本研究的应用创新,政策回应性为当前的高考改革和外语教育规划提供新的分析视角。
李朋朋[7](2019)在《基于互联网POI的中文地址要素库自学习构建方法研究》文中研究表明随着互联网技术的发展,网页中所涉及有关空间位置的信息也越来越多,使其成为地理信息数据获取和更新的重要数据来源之一。但是,由于互联网数据的多样性、复杂性和异构性等特征,使得对于它们的挖掘与分析变成了一个新问题。关于中文地址要素库构建方法的研究就是其中问题之一,地址要素库作为地址信息资源集成、融合与管理的核心枢纽,承担着地址信息资源整合、支撑技术应用的职能,为社会公众和政府各职能部门提供可靠、高效、准确的地理位置定位服务。针对中文地址文本信息的描述特点和地址要素匹配服务的需求,本文从中文地址要素切分、语义标注及层级关系构建等方面进行了较为系统地研究,并设计开发了原型系统。主要的研究工作内容及创新点如下:(1)基于GRU神经网络的中文地址要素切分方法研究:针对传统机器学习模型对中文地址要素切分,需要人为的提取特征以及模型训练时间较长的缺点。提出了基于门控循环单元(Gated Recurrent Unit,GRU)神经网络的中文地址要素切分方法,并采用三词位标注法对切分字符进行标注。该神经网络具备自动学习特征,避免了人工特征选择对中文地址要素切分的影响。同时,三词位标注法提升了中文地址要素切分性能,减少了模型训练时间。基于百度地图中各类型的名录数据和POI兴趣点地址数据,对神经网络模型进行训练和验证实验,其结果表明,该网络模型相对于传统机器学习模型在切分性能和模型效率方面都有显着提升。(2)地址要素语义标注与层级关系构建:针对中文地址要素的语义标注通常采用地址文本间的语义关系进行标注,从而忽略了地址要素的空间位置信息的缺点。本文提出了基于关键词匹配和基于位置推测的地址要素语义标注方法,并通过Tire树构建了地址要素之间的层级关系。通过对切分后的地址要素进行实验分析,其结果表明,该标注方法在标注效率、标注准确率和标注覆盖率方面较其他方法具有明显优势。(3)原型系统设计与实现:根据各中文地址要素表之间的关联关系,本文设计了 7张不同结构的数据库表格,并在此基础上研发了中文地址要素管理系统,实现中文地址要素的切分、中文地址表达模式的统计以及中文地址要素的增、删、改、查等基本操作。
肖振强[8](2011)在《城市地址信息空间化的原理及方法研究》文中提出随着地理信息系统在各行业的广泛应用、我国城市规模的不断发展扩大以及街区范围的逐渐增大,城市管理部门对空间数据与非空间数据共享整合的要求日益迫切。由于地址信息并不直接等同于空间的地理位置,因此城市地址信息空间化正是解决这一问题的关键。通过对国内外地址信息空间化的应用进行全面研究发现,国外已经具备了成熟的地址匹配技术,但由于我国地址信息的特殊情况,不能够简单搬用这套方法。本文通过借鉴国外进行地址编码的经验,总结地址匹配的一般方法,并对我国城市地址进行系统分析,本着科学性、可行性和易推广性等原则,提出了一种新的解决办法。通过对中文地址的特点和编码规则进行总结,并设计出符合进行中文城市地址信息空间化的地址数据库。在对众多中文分词算法进行研究的基础上,提出一种新的、适合我国地址现状的,以正则表达式和中文分词为基础的中文地址分词和地址标准化算法,能够对中文地址进行有效清洗和整理,并最终进行成功地匹配。在以上研究的基础上,开发出以武汉市为例的中文地址匹配引擎,实现了中文地址匹配的功能,将属性信息同空间位置进行关联,大大提高了城市信息空间化的效率。该引擎已在武汉市国土规划管理信息系统和新疆石河子规划系统中得到应用。
于滨[9](2010)在《面向经济普查项目需求的模糊中文地址匹配方法研究》文中提出地理(地址)编码技术是GIS中的一项基础性技术,它是将自然语言描述的地址信息,通过地址标准化、地址分词、数据库匹配、空间定位等一系列处理操作,赋予其空间位置信息,并最终定位到电子地图上的过程。随着GIS技术的不断发展与推广,越来越多的行业应用中出现了对于地理编码技术的需求,例如公共卫生、犯罪分析、政治科学、灾害管理、交通预测等领域。国外的地理编码技术已经日趋成熟,逐步迈向了市场化、产业化。但是由于国情的不同,国外的现有技术无法直接应用于我国的地理编码需求。因此,针对中文的地理编码技术有待于我们的进一步研究和完善。本文利用北京市的部分经济普查统计数据进行了相关的地址匹配研究,并最终开发实现了面向经济普查的地理编码工具软件。在研究过程中,本文主要针对地理编码技术中的以下几个方面进行了探索与改进:(1)由于目前地址匹配过程中,对于地址残缺与地址歧义两类模糊地址的匹配成功率与准确率偏低,所以本文提出了一种基于规则的地址分词匹配方法,通过对算法的改进,加入规则树与歧义存储等机制,提高了对于这两类模糊地址的匹配成功率。(2)由于传统地址匹配过程中,地址分词与数据库匹配两个步骤相对独立,导致数据库访问次数过多,系统运行效率低下。为此,本文在所提出的基于规则的地址分词匹配方法中,将两个过程合二为一,边分词边匹配,实现了在最终分词结束的同时获得匹配结果的目的,从而提高了地址匹配的效率。(3)对于目前已有的地址模型进行了部分改进,根据地址记录中存在行政区划部分与街道信息部分的区别,对两部分信息分别进行处理与存储,提高了地址数据的匹配速度。(4)为了减少地址数据采集和地址标准化的成本与工作量,本文有效利用了经济普查项目中的已有数据,通过数据挖掘,建立了标准地址库并完成了地理编码任务。
张雪英,闾国年,李伯秋,陈文君[10](2010)在《基于规则的中文地址要素解析方法》文中指出在日常生产与生活中,地址是最常见的使用自然语言描述地理位置的参考系统之一。地址地理编码技术被认为是大量业务数据的G IS实现可视化定位和空间分析的桥梁,在房地产管理、土地管理、城市规划、公安、邮政、税收、电讯和公共卫生等领域中具有十分重要的应用前景。地址要素解析是中文地址编码的核心技术之一。它是将自然语言描述的地址拆分为在某一限定区域内,可以指定某一地理范围的地址要素的过程。实际上,这个过程可以被看作是一种特定的中文分词任务。由于语言和文化的原因,中文地址描述采用连续的字符串,而且普遍存在不规范现象。目前,采用的地址解析方法在较大程度上受限于词典的更新维护和规则的不完备问题。本文以大规模地名词典和地址数据库为数据源,通过系统分析地址要素的构词特征和句法模式,构建了各类地址要素的特征字库,提出了中文地址的数字表达方法,设计了RBAI中文地址要素解析算法,开发了相应的原型系统。实验结果准确率达到92%以上,处理效率达2800条/秒。这表明该方法符合大规模数据处理的应用需求,具有重要的推广应用价值。
二、北京市地理编码数据库的研究(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、北京市地理编码数据库的研究(论文提纲范文)
(1)基于时空异构信息网的盗窃犯罪防控系统(论文提纲范文)
摘要 |
Abstract |
引言 |
1 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 国内外关于犯罪时空预测领域的理论 |
1.2.2 国内外犯罪时空预测方法的分类 |
1.2.3 已有研究的总结 |
1.2.4 已有研究的不足 |
1.3 研究内容、数据与科学意义 |
1.3.1 研究内容与技术路线 |
1.3.2 研究区域与数据来源 |
1.3.3 本文工作创新性 |
1.4 论文章节结构 |
2 基于时空异构信息网的环境因素建模 |
2.1 研究概述 |
2.2 宏观时空变量 |
2.2.1 数据简介及预处理 |
2.2.2 综合人工经验和机器学习模型的时空结构特征提取 |
2.2.3 异构信息网构建及基于异质图表示学习的时空功能特征获取 |
2.3 微观认知变量 |
2.3.1 数据简介及预处理 |
2.3.2 场景语义树及场景图谱的构建 |
2.3.3 训练集标签处理 |
2.3.4 模型训练及结果 |
2.4 原生犯罪风险生成 |
2.5 小结 |
3 基于统一机会出行模型的犯罪主体行为因素建模 |
3.1 研究概述 |
3.2 基于时空的犯罪风险平滑处理 |
3.2.1 基于自然语言处理的地理编码及路网匹配 |
3.2.2 基于双指数衰退模型的时间维度增广 |
3.3 基于有效距离模型的空间距离值重构 |
3.4 基于异构网络嵌入的主体关系特征获取 |
3.5 基于统一机会出行模型的出行概率预估 |
3.6 小结 |
4 基于犯罪模式理论的深度学习犯罪预测模型及系统 |
4.1 研究概述 |
4.2 基于时空图神经网络的犯罪预测基线模型 |
4.3 基于点击率预估场景中的机器学习模型的犯罪预测 |
4.4 融合热点迁移规律的预估犯罪率纠偏机器学习模型 |
4.4.1 犯罪吸引地区时空风险地图和社区时空风险地图 |
4.4.2 犯罪时空转移特征提取及深度学习CTR模型预测 |
4.5 基于动态时空风险地图的智能警务巡控原型系统设计与实现 |
4.6 小结 |
5 结论 |
参考文献 |
附录A 路段速度特征工程代码 |
附录B 路段空间形态特征工程代码(包括方向编码和空间形态编码) |
附录C 场景语义树 |
附录D 光线度获取代码 |
附录E 利用graph_tool计算有效距离 |
附录F 潜在落脚点筛选条件对应的POI/AOI类别/标签 |
附录G 潜在犯罪吸引地区筛选条件对应的POI/AOI类别/标签 |
附录H 社区筛选条件对应的POI/AOI类别/标签 |
附录I 警员信息示例 |
在学研究成果 |
致谢 |
(2)基于Hadoop的轨迹大数据模型及可视化方法研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景及意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 国内外研究现状 |
1.2.1 轨迹大数据技术发展现状 |
1.2.2 Web GIS可视化研究现状 |
1.3 研究内容及技术路线 |
1.4 论文组织结构 |
第2章 相关研究理论与技术 |
2.1 轨迹大数据相关理论 |
2.1.1 轨迹大数据概述 |
2.1.2 数据聚类算法 |
2.1.3 Hadoop分布式文件系统 |
2.2 地图数据相关理论 |
2.2.1 Geohash编码 |
2.2.2 地图数据存储模型 |
2.3 数据可视化技术 |
2.3.1 数据可视化概述 |
2.3.2 基于Web的数据可视化 |
2.4 本章小结 |
第3章 基于DBSCAN聚类的快速可视化研究 |
3.1 数据支撑 |
3.2 交通数据预处理 |
3.2.1 数据存储 |
3.2.2 数据清洗 |
3.3 多分辨率渲染的出租车数据轨迹模型 |
3.3.1 轨迹数据存储模型 |
3.3.2 聚类轨迹数据存储模型 |
3.4 瓦片数据存储模型 |
第4章 基于HADOOP的可视化平台设计与实现 |
4.1 平台总体架构 |
4.2 分布式数据查询模块 |
4.3 轨迹数据可视化模块 |
4.3.1 基于聚类的热力图可视化 |
4.3.2 散点图可视化 |
4.4 查询测试 |
4.4.1 瓦片数据查询 |
4.4.2 轨迹点数据查询测试 |
4.4.3 热力图可视化测试 |
4.5 系统平台实现 |
4.5.1 系统结构设计 |
4.5.2 系统功能 |
第5章 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
致谢 |
(3)基于BERT预训练模型的中文地址解析和匹配方法研究(论文提纲范文)
资助项目 |
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.2.1 地址标准与规范 |
1.2.2 中文地址要素分类与模型结构 |
1.2.3 中文地址解析方法 |
1.2.4 中文地址匹配方法 |
1.2.5 存在问题及分析 |
1.3 研究目标、研究内容与技术路线 |
1.3.1 研究目标 |
1.3.2 研究内容 |
1.3.3 技术路线 |
1.4 论文组织结构 |
第2章 中文地址要素分类与组合模式分析 |
2.1 中文地址的特征分析 |
2.2 中文标准地址要素分类 |
2.3 中文地址中的空间关系表达 |
2.3.1 拓扑关系 |
2.3.2 方向关系 |
2.3.3 距离关系 |
2.4 中文地址组合模式 |
2.5 实验与分析 |
2.5.1 实验数据概况 |
2.5.2 模式验证与结果分析 |
2.6 本章小结 |
第3章 基于预训练模型的中文地址解析方法 |
3.1 中文地址解析模型设计 |
3.1.1 BERT预训练模型 |
3.1.2 Bi LSTM-CRF模型 |
3.1.3 基于BERT-Bi LSTM-CRF的中文地址解析 |
3.2 中文地址标注规范 |
3.3 中文地址标注的数据增强方法 |
3.3.1 文本数据增强方法 |
3.3.2 基于地址要素的数据增强方法 |
3.4 地址解析方法评估 |
3.5 实验与分析 |
3.5.1 实验数据 |
3.5.2 实验环境 |
3.5.3 模型训练 |
3.5.4 结果与分析 |
3.6 本章小结 |
第4章 基于中文地址要素索引的地址匹配方法 |
4.1 中文地址匹配流程 |
4.2 中文地址匹配策略 |
4.3 中文地址要素索引构建方法 |
4.4 中文地址相似度计算模型 |
4.5 中文地址匹配评估方法 |
4.6 实验与分析 |
4.6.1 实验环境 |
4.6.2 结果与分析 |
4.7 本章小结 |
第5章 结论与展望 |
5.1 主要研究成果与结论 |
5.2 下一步研究工作 |
参考文献 |
读研期间发表的学术论文及研究成果 |
致谢 |
(4)DRG支付制度下三级公立医院主诊医师绩效评价及提升策略研究(论文提纲范文)
摘要 |
ABSTRACT |
1 绪论 |
1.1 研究背景 |
1.2 研究问题的提出 |
1.3 研究意义 |
1.4 研究目标 |
1.5 研究内容 |
1.5.1 医师绩效评价研究现状及理论基础 |
1.5.2 DRG支付制度下三级公立医院主诊医师绩效评价理论模型构建 |
1.5.3 DRG支付制度下三级公立医院主诊医师绩效评价工具的研发 |
1.5.4 基于DEMATEL-ISM的三级公立医院主诊医师绩效影响因素分析 |
1.5.5 基于决策树的三级公立医院主诊医师绩效影响因素实证分析 |
1.5.6 三级公立医院主诊医师绩效提升策略 |
1.6 资料来源 |
1.6.1 文献资料来源 |
1.6.2 数据资料来源 |
1.7 研究方法 |
1.7.1 文献研究法 |
1.7.2 SWOT分析法 |
1.7.3 现场调研法 |
1.7.4 数据分析方法 |
1.7.5 数据资料的质量控制方法 |
1.8 研究逻辑框架 |
1.9 创新之处与不足之处 |
1.9.1 创新之处 |
1.9.2 不足之处 |
2 研究现状与理论基础 |
2.1 医师绩效评价的文献计量学研究 |
2.1.1 资料来源 |
2.1.2 纳入与排除标准 |
2.1.3 统计分析 |
2.1.4 结果 |
2.2 相关理论基础 |
2.2.1 绩效评价相关理论 |
2.2.2 绩效影响因素相关理论 |
2.3 本章小结 |
3 DRG支付制度下三级公立医院主诊医师绩效评价理论框架构建 |
3.1 DRG支付制度下我国三级公立医院发展战略SWOT分析 |
3.1.1 优势 |
3.1.2 劣势 |
3.1.3 机遇 |
3.1.4 挑战 |
3.1.5 DRG支付制度下我国三级公立医院发展战略 |
3.2 DRG支付制度下三级公立医院主诊医师绩效评价关键问题分析 |
3.2.1 三级公立医院主诊医师绩效评价应以医疗质量为基础 |
3.2.2 评价内容应充分结合主诊医师岗位职责及特点 |
3.2.3 评价指标应纳入基于DRG的绩效评价相关指标 |
3.3 三级公立医院主诊医师绩效评价原则 |
3.4 三级公立医院主诊医师绩效评价维度及具体目标 |
3.5 三级公立医院主诊医师绩效评价指标体系 |
3.6 绩效评价结果的应用 |
3.7 DRG支付制度改革下三级公立医院主诊医师绩效评价理论框架 |
3.8 本章小结 |
4 绩效评价工具的研发 |
4.1 国内外医师绩效评价指标的描述性系统评价 |
4.1.1 资料与方法 |
4.1.2 结果 |
4.2 DRG支付制度改革下医师绩效评价特点分析 |
4.2.1 我国DRG支付制度改革基本情况 |
4.2.2 研究对象 |
4.2.3 研究工具 |
4.2.4 数据分析 |
4.2.5 结果 |
4.2.6 DRG支付制度改革医院管理及医师产生的影响 |
4.2.7 DRG支付制度下医师绩效评价的特点分析 |
4.3 DRG支付制度下三级公立医院主诊医师绩效评价工具的研发 |
4.3.1 绩效评价指标的初步选取 |
4.3.2 确定专家组 |
4.3.3 德尔菲专家咨询 |
4.3.4 信度分析 |
4.3.5 效度检验 |
4.3.6 绩效评价指标权重的确定 |
4.4 本章小结 |
5 三级公立医院主诊医师绩效影响因素分析 |
5.1 三级公立医院主诊医师绩效影响因素框架模型的构建 |
5.1.1 环境层面影响因素分析 |
5.1.2 医疗教育层面影响因素分析 |
5.1.3 医师个人特质层面影响因素分析 |
5.1.4 三级公立医院主诊医师绩效影响因素框架模型 |
5.2 基于DEMATEL-ISM的主诊医师绩效影响因素建模 |
5.2.1 三级公立医院主诊医师影响因素释义 |
5.2.2 建模分析步骤 |
5.2.3 问卷设计与数据收集 |
5.2.4 DEMATEL分析 |
5.2.5 ISM分析 |
5.3 基于决策树的主诊医师绩效影响因素实证分析 |
5.3.1 数据来源及样本说明 |
5.3.2 变量取值 |
5.3.3 医师绩效实证评价结果分析 |
5.3.4 决策树分析 |
5.4 本章小结 |
6 讨论与建议 |
6.1 DRG支付制度下三级公立医院主诊医师绩效评价理论模型构建讨论 |
6.2 绩效评价工具研发讨论 |
6.3 三级公立医院主诊医师绩效影响因素分析讨论 |
6.3.1 绩效影响因素遴选 |
6.3.2 医师绩效影响因素分析讨论 |
6.4 策略建议 |
6.4.1 加强政府对公立医院的补偿力度,健全财政投入保障机制 |
6.4.2 医院应制定符合时代发展特征及医院功能定位的组织发展战略 |
6.4.3 建立科学的、精细化的三级公立医院主诊组管理模式 |
6.4.4 提升医学院校教育质量,提高医师绩效教育的重视程度 |
6.4.5 提升医师工作满意度水平 |
6.4.6 关注医师心理健康,提升医师压力应对能力 |
6.4.7 制定符合行业特点的的医师薪酬水平与激励机制 |
7 总结与展望 |
7.1 研究创新 |
7.1.1 研究内容创新 |
7.1.2 研究方法创新 |
7.2 研究不足 |
7.3 研究展望 |
7.3.1 研究样本的展望 |
7.3.2 研究思路的扩展 |
致谢 |
参考文献 |
研究综述 |
参考文献 |
附件1 攻读学位期间发表论文目录 |
附件2 我国三级公立医院主诊医师绩效评价指标体系调查问卷 |
附件3 三级公立医院主诊医师绩效影响因素打分表 |
附件4 三级公立医院主诊医师绩效评价影响因素调查问卷 |
附件5 三级公立医院主诊医师绩效评分表 |
(5)基于地理编码的农村教育资源可达性研究 ——以株洲县为例(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 研究综述 |
1.2.1 中文地址匹配技术研究 |
1.2.2 公共服务设施空间布局研究 |
1.2.3 基础教育资源空间布局研究 |
1.3 研究目的与意义 |
1.4 研究内容 |
第二章 研究区概况与研究路线 |
2.1 研究区概况 |
2.2 研究思路与技术路线 |
2.2.1 研究思路 |
2.2.2 技术路线 |
2.3 数据来源与处理 |
第三章 基于地理编码获取学生空间分布 |
3.1 地址结构化 |
3.1.1 匹配词典建立 |
3.1.2 中文分词算法 |
3.1.3 地址结构化流程 |
3.2 学生与学校空间分布 |
3.2.1 学生坐标获取情况 |
3.2.2 学生与学校空间分布状况 |
第四章 教育资源获取距离成本分析 |
4.1 学生就近入学情况 |
4.1.1 研究区整体情况 |
4.1.2 分镇统计情况 |
4.1.3 路网距离与直线距离对比 |
4.2 学生实际入学情况 |
4.2.1 实际入学距离统计 |
4.2.2 非就近入学情况分析 |
4.3 本章小结 |
第五章 教育资源服务范围与供需规模分析 |
5.1 乡镇边界服务区的教育资源配置情况 |
5.2 路网范围服务区的教育资源配置情况 |
5.3 最近距离服务区的教育资源配置情况 |
5.4 本章小结 |
第六章 教育资源空间可达性分析 |
6.1 两步移动搜索法 |
6.1.1 高斯型两步移动搜索法 |
6.1.2 算法实现 |
6.2 教育资源可达性分析结果 |
第七章 结论与展望 |
7.1 主要结论 |
7.2 不足与展望 |
参考文献 |
附录A 攻读学位期间发表的论文与科研成果清单 |
致谢 |
(6)舆情视角下外语教育政策回应性探究 ——基于高考英语政策变迁的经验研究(论文提纲范文)
致谢 |
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景 |
1.1.1 语言政策和规划学科的兴起 |
1.1.2 外语教育规划中的认同与冲突 |
1.1.3 我国的外语教育政策与高考英语 |
1.1.4 政务舆情回应的建设 |
1.2 研究目的 |
1.3 研究意义 |
1.4 论文结构 |
1.5 研究思路 |
第二章 文献综述 |
2.1 引言 |
2.2 舆情研究概况 |
2.2.1 舆情的概念内涵 |
2.2.2 基于引文空间分析的教育舆情研究概况 |
2.2.3 高考舆情研究 |
2.2.4 语言舆情研究 |
2.2.5 英文文献中关于公众意见的研究 |
2.3 舆情和政策的关系研究 |
2.3.1 舆情与政策结果的关系 |
2.3.2 舆情与政策过程的关系 |
2.4 政策回应性研究 |
2.4.1 政策回应性的理论研究 |
2.4.2 教育政策回应性的相关研究 |
2.5 制度变迁的理论基础研究 |
2.5.1 新制度主义理论 |
2.5.2 话语制度主义理论 |
2.6 本章小结 |
第三章 研究设计 |
3.1 引言 |
3.2 概念框架和研究问题 |
3.2.1 关键概念定义 |
3.2.2 概念框架和研究问题 |
3.3 研究方法阐述 |
3.3.1 质性研究路径 |
3.3.2 研究方法 |
3.4 数据采集和处理 |
3.4.1 数据资源库 |
3.4.2 媒体数据采集 |
3.4.3 数据下载 |
3.4.4 数据处理 |
3.5 类目建构 |
3.6 研究伦理 |
3.7 本章小结 |
第四章 高考英语政策变迁及制度语境 |
4.1 引言 |
4.2 英语科目地位变化 |
4.2.1 稳定上升时期(1978-2001 年) |
4.2.2 调整变化期(2002-2013) |
4.2.3 巩固发展期(2014-) |
4.3 高考英语命题内容和方式的变化 |
4.3.1 命题依据的变化 |
4.3.2 高考英语统一和分省命题变化 |
4.3.3 高考英语听说测试政策的变化 |
4.4 本章小结 |
第五章 高考英语舆情的总体特征 |
5.1 引言 |
5.2 舆情的报纸媒体特征 |
5.2.1 时空特征 |
5.2.2 媒体分布特征 |
5.2.3 新闻主题框架分析 |
5.2.4 报纸媒体舆情热点事件 |
5.3 舆情的社交媒体特征 |
5.3.1 北京高考改革热门微博 |
5.3.2 浙江加权赋分事件热门微博 |
5.4 舆情的学术期刊话语 |
5.4.1 《人民教育》关于第一次高考改革大讨论 |
5.4.2 《外国语》高考外语改革论坛 |
5.5 本章小结 |
第六章 高考英语舆情的政策回应 |
6.1 引言 |
6.2 第一次高考改革舆情和政策回应 |
6.2.1 改革前舆情 |
6.2.2 回应前舆情话语分析 |
6.2.3 政策回应性分析 |
6.2.4 回应结果分析 |
6.3 江苏新课程高考改革舆情和政策回应 |
6.3.1 改革背景 |
6.3.2 舆情特征分析 |
6.3.3 回应前舆情话语分析 |
6.3.4 回应过程舆情话语特征 |
6.3.5 政策回应性结果分析 |
6.4 北京高考综合改革舆情和政策回应 |
6.4.1 改革背景 |
6.4.2 舆情特征分析 |
6.4.3 回应前舆情话语分析 |
6.4.4 回应过程舆情话语特征 |
6.4.5 政策回应性结果分析 |
6.5 高考突发事件性舆情和政策回应 |
6.5.1 高考外语听力的政策回应性 |
6.5.2 浙江高考英语加权赋分事件 |
6.6 本章小结 |
第七章 启示与结论 |
7.1 引言 |
7.2 高考英语舆情的政策回应模式 |
7.3 回应性外语教育政策的发展路径 |
7.3.1 正确认识观念性冲突 |
7.3.2 合理运用舆情调查 |
7.3.3 发挥舆论环境建设的作用 |
7.4 研究总结 |
7.5 研究局限性与展望 |
参考文献 |
附录1 关于北京高考改革方案(2013)的热门微博 |
附录2 关于北京高考英语改革方案(2013 年)的话语提炼 |
(7)基于互联网POI的中文地址要素库自学习构建方法研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 国外现状 |
1.2.2 国内现状 |
1.2.3 存在问题 |
1.3 研究目标与研究内容 |
1.3.1 研究目标 |
1.3.2 研究内容 |
1.4 论文组织结构 |
2 基于GRU神经网络的中文地址要素切分 |
2.1 概述 |
2.2 神经网络介绍 |
2.2.1 循环神经网络 |
2.2.2 LSTM神经网络 |
2.2.3 GRU神经网络及模型 |
2.3 基于神经网络中文分词方法 |
2.4 基于GRU的中文地址要素切分 |
2.4.1 地址字符向量化 |
2.4.2 标签推断 |
2.4.3 模型训练 |
2.5 实验结果与分析 |
2.5.1 实验环境、数据集和评测指标 |
2.5.2 实验参数的设置 |
2.5.3 实验结果与分析 |
2.6 本章小结 |
3 地址要素语义标注与层级关系构建 |
3.1 概述 |
3.2 地址要素分类标注体系 |
3.3 基于关键词匹配的地址要素语义标注 |
3.4 基于位置推测的地址要素语义标注 |
3.4.1 区域面积计算 |
3.4.2 分布离散度计算 |
3.4.3 地址要素语义标注 |
3.5 中文地址要素层级关系构建 |
3.5.1 地址模型分类 |
3.5.2 地址模式统计 |
3.6 实验结果与分析 |
3.6.1 实验数据 |
3.6.2 地址要素语义标注实验分析 |
3.6.3 地址要素库构建 |
3.7 本章小结 |
4 原型系统设计与实现 |
4.1 数据库表结构设计 |
4.2 系统流程设计 |
4.3 系统框架设计 |
4.4 系统主要功能展现 |
4.5 本章小结 |
5 结论与展望 |
5.1 研究结论 |
5.2 展望 |
致谢 |
参考文献 |
攻读硕士期间科研情况 |
(8)城市地址信息空间化的原理及方法研究(论文提纲范文)
摘要 |
ABSTRACT |
1 绪论 |
1.1 论文研究的背景及意义 |
1.2 国内外研究现状 |
1.3 研究目标与内容 |
2 城市地址信息空间化方法 |
2.1 信息空间化的基本方法 |
2.2 基于地理格网的空间化方法 |
2.3 基于地址匹配的空间化方法 |
2.4 本章小结 |
3 中文地址的组成特点及规则 |
3.1 英文地址的特点 |
3.2 中文地址的特点 |
3.3 中文地址组成形式和规则 |
3.4 地址数据库设计 |
3.5 本章小结 |
4 中文地址匹配算法 |
4.1 中文分词方法 |
4.2 地址标准化 |
4.3 中文地址匹配流程 |
4.4 本章小结 |
5 中文地址匹配软件设计 |
5.1 系统开发工具及平台 |
5.2 系统功能实现 |
5.3 地址匹配引擎在综合系统中的应用 |
5.4 本章小结 |
6 结论与展望 |
6.1 结论 |
6.2 展望 |
致谢 |
参考文献 |
作者学习经历和科学研究 |
(9)面向经济普查项目需求的模糊中文地址匹配方法研究(论文提纲范文)
摘要 |
ABSTRACT |
目录 |
第一章 绪论 |
1.1 地理编码概述 |
1.2 研究背景 |
1.3 国外研究现状 |
1.4 国内研究现状 |
1.5 研究的目的和意义 |
1.6 本文的组织结构 |
第二章 地理编码关键技术 |
2.1 地址标准化 |
2.2 地址分词 |
2.3 数据库匹配 |
2.4 空间定位 |
2.5 本章小结 |
第三章 基于规则的中文地址分词匹配方法 |
3.1 地址模型研究 |
3.2 标准地址库的建立 |
3.3 规则库与规则树的建立 |
3.4 模糊地址分析研究 |
3.5 基于规则的模糊中文地址分词匹配算法 |
3.6 论文所述算法的优势 |
3.7 本章小结 |
第四章 面向经济普查的地理编码系统设计与实现 |
4.1 地理编码系统构架 |
4.2 地理编码系统设计方案 |
4.2.1 实验平台与工具的选择 |
4.2.2 数据库设计 |
4.2.3 功能模块的划分 |
4.3 地理编码系统的实现 |
4.3.1 系统概述 |
4.3.2 系统要求 |
4.3.3 标准地址库创建 |
4.3.4 标准地址库管理 |
4.3.5 单个地址匹配 |
4.3.6 批量地址匹配 |
4.4 本章小结 |
第五章 地理编码实验设计与结果分析 |
5.1 数据来源与分析 |
5.2 数据的提取 |
5.3 数据的预处理 |
5.4 数据的筛选与样本的选择 |
5.5 建立标准地址库 |
5.6 实验结果与分析 |
5.7 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
攻读硕士期间发表的论文及参与的项目 |
(10)基于规则的中文地址要素解析方法(论文提纲范文)
1 引言 |
2 国内外地址地理编码的研究进展 |
3 地址要素解析方法 |
3.1 地址要素特征字 |
(1) 主特征字: |
(2) 附属特征字: |
3.2 地址要素解析规则 |
3.3 地址要素解析算法 |
(1) 地址表示:将原始地址转换为数字表示, 结果为Numbers_Before第1步:Numbers_Before置为空串;用n表示当前待解析原始地址的长度 |
(2) 地址解析:将Numbers_Before根据解析规则拆分为地址要素, 结果为Numbers_After第4步:Numbers_After置为空串;用k表示Numbers_before的长度 |
(3) 地址还原: |
4 实验评估 |
5 结论 |
四、北京市地理编码数据库的研究(论文参考文献)
- [1]基于时空异构信息网的盗窃犯罪防控系统[D]. 顾海硕. 中国人民公安大学, 2021(08)
- [2]基于Hadoop的轨迹大数据模型及可视化方法研究[D]. 张昊. 北京建筑大学, 2021(01)
- [3]基于BERT预训练模型的中文地址解析和匹配方法研究[D]. 张航. 南京师范大学, 2021
- [4]DRG支付制度下三级公立医院主诊医师绩效评价及提升策略研究[D]. 林夏. 华中科技大学, 2020(01)
- [5]基于地理编码的农村教育资源可达性研究 ——以株洲县为例[D]. 李佳. 湖南科技大学, 2020(06)
- [6]舆情视角下外语教育政策回应性探究 ——基于高考英语政策变迁的经验研究[D]. 刘新国. 上海外国语大学, 2020(07)
- [7]基于互联网POI的中文地址要素库自学习构建方法研究[D]. 李朋朋. 兰州交通大学, 2019(03)
- [8]城市地址信息空间化的原理及方法研究[D]. 肖振强. 山东科技大学, 2011(05)
- [9]面向经济普查项目需求的模糊中文地址匹配方法研究[D]. 于滨. 中南大学, 2010(02)
- [10]基于规则的中文地址要素解析方法[J]. 张雪英,闾国年,李伯秋,陈文君. 地球信息科学学报, 2010(01)