多源数据融合驱动的图书馆智能化阅读推广平台设计★

吴海春 林志益

(琼台师范学院图书馆 海南 海口 571100)

近年来国家和政府提倡深入推进全民阅读,全民阅读也已连续9年被写入《政府工作报告》中。图书馆作为社会教育机构之一,积极响应国家政策,通过举办阅读推广活动,激发全民的阅读热情,提高全民的阅读素养和信息素养。图书馆在开展阅读推广活动时主要面临以下挑战[1]:一是阅读推广活动受众范围有限,缺乏跨区域的交流和互动途径;
二是活动开展存在周期性(一般在读书月举办系列推广活动),长期性和持续性相对不足;
三是图书馆与图书馆之间的沟通交流较少,资源共享效果不佳,资源重复建设现象严重。为解决以上不足,图书馆开始尝试构建阅读推广平台,目前关于阅读推广平台的研究主要集中在利用用户行为感知技术设计数字期刊服务推送系统[2]、基于区块链技术设计阅读平台[3]、利用混合现实技术设计数字化阅读界面[4]、利用5G和AI技术提供智能化阅读服务[5]等。通过阅读推广服务平台,读者可以及时享受到图书馆的资源服务。虽然阅读推广平台解决了用户个性化、精准化的资源服务需求,但目前服务平台众多,容易造成读者操作不便以及个人信息泄露、资源重复建设、信息不对称等问题。因此,本文基于多源数据融合技术建立了多源数据融合驱动的图书馆智能化阅读推广平台架构和工作流程,旨在为图书馆优化阅读推广服务内容和提高用户体验提供参考。

1.1 多源数据融合

多源数据融合是指对不同来源、不同结构或相同结构的数据进行判断、清洗、分析、集成的过程[6]。多源数据融合可分为阶段性融合、特征拼接融合和语义融合[7]。数据阶段性融合是指分阶段处理数据,先处理一种类型数据接着再处理另一类型数据;
特征拼接融合是指利用深度学习、特征串联等方法融合多源数据;
语义融合是指通过相似度算法、知识关联等方法识别数据特征与特征之间的关系,并进行数据语义信息融合。目前图情领域关于多源数据的研究主要集中在理论研究[8]、图书馆资源整合[9]、学科评价[10]、智慧图书馆建设[11]等领域,图书馆通过多源数据融合的方法,为用户提供精准化、个性化的信息服务。

1.2 图书馆阅读推广服务

阅读推广是图书馆发挥社会教育作用的重要手段[12]。图书馆通过开展知识竞赛、图书分享、专题讲座等形式激发公众的阅读兴趣,全面提高公众的文化素质。目前,关于图书馆阅读推广的研究主要集中在概念研究、策略研究、系统研究、阅读行为研究等方面。黄佳[13]利用生命周期理论构建了图书馆阅读推广服务体系,以期为图书馆阅读推广服务提供理论支撑和实践借鉴;
孙静静[14]分析了如何将4R理论应用到图书馆阅读推广活动中,优化了阅读推广服务策略;
路锦怡等[15]设计了针对儿童的绘本标识系统,该系统可以提高儿童查询绘本的成功率;
Langendonk A等[16]研究了荷兰全国性的阅读推广计划——“阅读的艺术”,该计划对学生和老师的阅读行为有正向的促进作用。

1.3 图书馆阅读推广平台

根据超星公司对阅读推广系统的定义[17],全民阅读推广系统是指以图书馆馆藏数字资源为基础,利用互联网等传播媒介,以各个终端应用的形式推送给不同场景下的读者,让全民阅读无处不在。数字化时代的图书馆要充分利用自身的资源和平台优势以及数字化信息技术,构建一个立体的阅读推广服务体系——数字化阅读推广系统。目前学者们关于图书馆阅读推广平台的研究更多地将阅读推广平台当作阅读推广服务平台[18-19],在此平台上读者可以随时随地享受到图书馆的数字化阅读资源,同时可以进行阅读资源的分享和传播,从而拓宽图书馆读者的覆盖面,达到促进全民阅读的目的。本文的图书馆智能化阅读推广平台是指基于集智能化操作、服务为一体的数字化阅读推广平台,建立该系统的目的是充分挖掘用户需求,激发用户阅读积极性,同时促进不同图书馆机构间的资源交流和共享,提高资源利用效率。

2.1 图书馆智能化阅读推广平台的功能需求分析

随着数字化阅读的兴起以及大数据、人工智能等技术的迅猛发展,用户更加追求智能化、精准化、个性化的阅读推广平台[20]。多源数据融合驱动下的图书馆智能阅读推广平台主要包含以下功能需求:(1)实现精准化服务。随着信息技术的发展,读者的需求更加个性化、多样化。目前图书馆的阅读推广活动对读者的个性化需求关注仍稍显不足,活动内容主要针对大多数读者的需求开展,因此,图书馆阅读推广平台要充分分析用户需求和用户特征信息,为用户提供实时且精准的阅读推广服务。(2)实现智能化操作。5G、人工智能、AR、VR等技术的兴起,读者更加注重在阅读推广平台中的智能交互体验。因此,图书馆阅读推广系统要充分利用新兴技术实现系统智能化推荐、智能化检索、智能化阅读导航、智能化预约等操作,增强用户在阅读中的互动体验,同时为用户提供体验反馈途径,以便系统不断完善用户画像,实现对用户信息的精准捕捉。(3)实现跨机构资源共享。虽然目前图书馆搭建了一些阅读推广平台,但不同机构间的阅读推广平台缺乏数据共享通道,容易造成资源重复建设和资源浪费等情况。因此,多源数据融合驱动的图书馆智能化阅读推广平台要充分利用多源数据融合技术实现跨机构资源融合,促进图书馆间的交流共享,提高资源的利用效率。

2.2 图书馆智能化阅读推广平台的多源数据分析

本文将图书馆智能化阅读推广平台的数据来源分为用户数据、资源数据和场景数据(见表1)。用户数据是图书馆开展精准化阅读推广服务的主要数据来源。随着图书馆举办阅读推广活动次数的增加,用户与图书馆的互动日益频繁,用户的特征信息以及不同场景下的阅读推广活动数据均被广泛记录在图书馆的各个服务平台上。此外,图书馆资源数据是图书馆开展阅读推广服务的基础,将用户数据、场景数据与资源数据精确匹配,可以为用户提供精准化、个性化的阅读服务。

2.2.1 用户数据

用户数据包含基础数据和行为数据。用户基础数据是表征用户基本属性的数据,包含用户的基本信息数据和科研信息数据。用户特征数据可通过记录用户注册信息、问卷调查、数据库等方式获取。用户行为数据是指用户使用图书馆资源以及参与相关图书馆阅读推广活动的数据,如借阅数据、学习数据、数据库使用数据等。图书馆官网、公众号、馆藏数据库等设备上记录了用户的使用数据,能够反映用户使用图书馆资源进行学习、科研等的细节数据。图书馆通过深入挖掘这些行为数据,为后续用户画像分析奠定数据基础。

表1 图书馆智能化阅读推广平台的多源数据分析

2.2.2 资源数据

图书馆资源数据包含图书馆本身的馆藏资源以及其他机构共享的资源数据,数据类型包含图书、期刊、专利等,馆藏资源可通过各种类型的数据库获取,共享的资源数据可通过开源数据库以及共享的知识服务平台等获取。资源数据是图书馆开展智能化阅读推广服务的关键,随着数字图书馆建设的推进,数字资源的类型和数量爆发式增长,图书馆开展阅读推广服务时需要综合利用这些资源数据,为用户提供高质量的知识服务。

2.2.3 场景数据

场景数据是图书馆开展阅读推广服务应用场景数据,主要包括与活动开展相关的空间数据(如空间面积、空间的地理位置等)、设施设备数据等(如电脑、投影仪、实操仪器设备等)。服务场景数据一般是基于以往图书馆开展阅读推广活动时的记录所得。多源数据融合驱动的图书馆智能化阅读推广平台建立用户数据、资源数据、场景数据三者间的关联关系,从而实现精准化、智能化、个性化的阅读推广服务。

多源数据融合驱动为图书馆智能化阅读推广平台完善提供了新思路。本文在广泛采集多种数据来源的基础上,充分利用数据融合技术,实现数据分析、集成与关联,进而为用户提供精准化、智能化的阅读推广服务。具体而言,多源数据融合驱动的图书馆智能化阅读推广平台架构分为基础数据层、数据融合层、平台系统层(见图1)。基础数据层是服务系统多源数据融合驱动的基础,包含用户数据、资源数据和场景数据;
数据融合层主要进行多源数据的融合,为系统搭建提供高质量的数据集合;
平台系统层是阅读推广平台的应用层,面向用户提供智能化的阅读服务。

3.1 基础数据层

基础数据层是实现多源数据驱动构建智能化阅读推广系统的基础,图书馆需要广泛采集多源异构或同构数据,为后续数据融合奠定基础。基础数据层数据包含图书馆馆藏资源数据、用户特征数据以及图书馆在开展阅读推广活动所需的场景数据、活动数据等,数据采集过程中要尽量避免数据缺失,保证数据完整性。

图1 多源数据融合驱动的图书馆智能化阅读推广平台架构

3.2 数据融合层

数据融合层是实现智能化阅读推广服务的关键,从数据采集、分析到融合、应用,为后续系统服务奠定基础。首先收集和分析用户数据,分析用户需求,建立用户画像模型,分析用户特征和用户阅读偏好。接着系统建立用户特征数据、用户需求数据、资源数据、场景数据间的关联关系,进行数据融合,形成关联数据集。数据融合层主要涉及到智能数据分析技术、数据关联技术、知识网络技术、感知技术等技术,通过上述技术为多源异构数据融合提供保障。

3.3 平台系统层

平台系统层包含四个模块:阅读活动管理模块、资源管理模块、个人信息管理模块和数据安全模块。阅读活动管理模块主要管理阅读推广活动内容,包含活动筹备、执行、反馈评价等。资源管理模块主要存储各类出版资源、原创作品和共享资源等,可为用户提供精准的资源推送服务,系统根据用户需求的动态变化实时调整资源存储,不断完善图书馆资源配置。个人信息管理模块主要存储用户的阅读足迹、活动记录和基本信息,支持用户进行系统登录以及自主化资源使用,该模块可实现用户个性化资源收藏、下载、分享等服务。数据安全模块主要提供后台安全保障服务,防止个人数据泄露和资源泄露,该模块严格把控数据采集、存储等环节,并进行数据安全检测,当可能出现数据安全危险时及时向用户和图书馆提供安全预警,从而全方位保障数据安全性。

本文结合系统架构设计,将多源数据融合驱动的图书馆智能化阅读推广平台业务流程分为多源数据采集、数据处理、多源数据融合、应用服务四个步骤,不断满足用户智能化服务的需求。

4.1 多源数据采集

由于用户数据、资源数据、场景数据广泛分布在不同的系统平台和设备中,数据量大,数据类型各异,因此需要利用不同的技术进行数据采集。一方面,可以利用结构化数据采集工具(如Sqoop、ODI等)抽取标准化数据;
另一方面,可以利用非结构化数据采集工具(如Flume、Kattle等)采集用户访问数据、场景数据、开源网络数据等非结构化数据。在数据采集过程中,如碰到系统接口标准不一的情况,可将数据抽取到临时表或者数据交换平台进行存储,以便后续跨系统数据调用。

4.2 数据处理

由于用户数据、资源数据和场景数据来自不同的数据库、文件系统等,易受到数据冲突、数据缺失等影响,因此需要对多源异构或同构数据进行处理,提高数据的易用性。数据处理流程包含数据清洗、转换、统一、集成等环节,被处理后的数据可以整体提高数据质量,以保证多源数据融合的准确性与价值性。

4.3 多源数据融合

多源数据融合是图书馆智能化阅读推广系统构建的关键环节,服务系统可分别从用户需求关联、时空关联、资源关联等维度建立多源数据融合规则,搭建统一的数据整合框架,集成不同类型数据的关系特征,建立关系网络,从而实现多源异构数据的融合认知计算与融合分析,为后续图书馆阅读推广平台应用赋能。

4.4 应用服务

多源数据融合驱动的图书馆智能化阅读推广系统应用服务内容包含智能化推送服务、智能化检索服务、互动交流服务、自主学习服务等。智能化推送服务是指服务系统将用户画像分析结果与资源数据相匹配,为用户提供个性化资源推送服务,同时根据用户动态需求变化及时优化调整推送内容。智能化检索服务是指用户在该系统中输入检索词,系统可根据用户需求提供资源下载路径、知识推荐、知识关联等服务。互动交流服务是指一方面用户可以实时与图书馆馆员沟通交流,获取所需的阅读资源;
另一方面用户可以与共同参与阅读推广活动的其他用户进行互动交流,进行阅读心得分享,迸发出新的灵感。自主学习服务是指用户可通过该系统参与专题讲座、培训等活动,提高自身的阅读素养和信息素养。

大数据时代,多源数据融合驱动为图书馆阅读推广活动提供了新途径和新思路。未来图书馆一方面要不断完善阅读推广服务制度,从组织架构、人员配置、宣传机制、活动目标等整体规划阅读推广活动,促进图书馆阅读推广规模化、系列化发展,为阅读推广平台的优化完善奠定制度基础;
另一方面要构建系统评估体系,完善用户反馈渠道,不断为用户提供高质量的阅读服务以及丰富用户的阅读体验。

猜你喜欢智能化图书馆融合智能化战争多维透视军事文摘(2022年19期)2022-10-18村企党建联建融合共赢今日农业(2021年19期)2022-01-12融合菜中老年保健(2021年11期)2021-08-22从创新出发,与高考数列相遇、融合中学生数理化(高中版.高考数学)(2021年1期)2021-03-19印刷智能化,下一站……印刷工业(2020年4期)2020-10-27《融合》现代出版(2020年3期)2020-06-20图书馆小太阳画报(2018年1期)2018-05-14基于“物联网+”的智能化站所初探中国交通信息化(2017年4期)2017-06-06石油石化演进智能化能源(2015年8期)2015-05-26去图书馆小天使·一年级语数英综合(2014年8期)2014-06-26

推荐访问:智能化 融合 图书馆