2024年3月26日发(作者:)
ACADEMIC EXPLORATION |
学术探索
E
于用户画像的学术期刊精准化知识服务策略
向飒1)2) 杨媛媛1)
1 )郑州大学新闻与传播学院,450001,郑州;2)郑州大学学报编辑部,450001,郑州
摘要
为提升大数据时代我国学术期刊精准化知识服务
水平,
本文将用户画像技术
箐
引入学术期刊知识服务,并构建了学术期刊用户画像流程:一是系统收集用户的真实
原始数据并进行数据预处理,从中提取事实标签;二是对事实标签进行建模计算,获
取模型标签;三是对模型标签进行算法挖掘,得到预测标签;四是在预测标签基础上
构建作者画像、读者画像与专家画像。基于此,文章提出学术期刊精准化知识服务策
略,即,要立足用户特征,把握用户需求,搭建用户网络,细分用户标签,实现服务
模式精准化、内容多样化、方式社交化和推送个性化。
开放科学(资源服务)
标识码(
OSID
)
关键词
学术期刊;精准化知识服务;用户画像;大数据
《
STM
出版技术趋势2024》报告的主题是
“用户为中心”,指出未来的技术趋势是把用户
作为核心,根据用户需求,把技术无缝嵌入用户
的工作流程中,提供知识嵌入式服务 ' 面对大数
据时代海量增长的用户数据、内容数据、交互数
据,学术期刊基于大数据、人工智能和云计算技
术洞察用户需求、关注当前研究热点,为科研人
员提供精准化、个性化的知识服务是必然趋势。
相关研究表明,构建用户画像模型有助于更好地
理解用户需求,实现个性化和精准化信息服务。
用户画像是以大量真实用户数据为基础,对用户
行为、兴趣等进行特征抽取而形成的虚拟用户模
型,具有全面性、真实性、代表性、动态性以及
移情性等特征。
Massanari
121认为,用户画像是按
照用户姓名、兴趣、爱好和习惯等特征对用户进
行描述而形成的用户画像模型。很多学者都意识
到,用户画像是一种描绘用户特征、表达用户诉
求的,能实现精准信息服务的工具131。余传明141认
*基金项目:2019年度河南省哲学社科规划项目(2019
BXW
008 ); 2021年河南省教育厅人文社科项目“人工智會
g
和
为,用户画像是根据用户性别、受教育程度等人口
统计学特征、社交关系和行为模式等而构建的一种
标签化的用户模型。盛怡瑾[5]将用户画像技术应用
于学术期刊审稿人遴选中。刘英间认为,未来学术
期刊的数字出版离不开“精准”二字,学术期刊的
内容生产、出版流程、内容传播、运营盈利等都需
要围绕用户进行。向飒171认为,知识服务要为科研
用户在科研立项、文献检索、科研指导、论文撰写
等环节进行定制化、个性化服务。
但已有的文献中,关于用户画像与知识服
务结合探讨的文献鲜见。学术期刊想充分挖掘用
户数据、发现目标用户、分析用户需求,为用户
提供个性化服务,就必须将用户画像引入学术期
刊领域。用户画像可以利用数据挖掘对用户数据
之间的关系进行分析,发掘表面上复杂无序信息
的联系,将用户画像结果应用到精准信息服务领
域。只有充分建立用户画像的数据库,才能做到
精细化、定制化的知识服务。因此,本文试图通
过用户画像技术来满足学术期刊用户精准需求,
为学术期刊精准化知识服务提供具有可操作性的
策略。
大数据背景下智能出版系统的发展”(2021-
ZZGH
-380 )。
2021
年第
2
期|科技与出版
104
1
:XF)RA'
学术期刊用户画像的数据采集
用户画像的构建是搜集用户特征数据、研
查询的结构化数据。
究用户信息、细分标签、丰富用户画像描述的过
程。运用用户画像技术对真实存在的用户进行数
学建模,将用户特征标签化,所构建的用户画像
模型与用户越贴合,用户特征就越准确,用户画
像构建就越成功。
学术期刊自建网站、知网数据库、万方数据
库、维普数据库、期刊微信公众号等共同构成中
国学术期刊用户画像的基础数据库。可以从四个
方面釆集学术期刊用户元数据,如表1所示。用
户数据的釆集主要釆用自编程序、八爪鱼爬虫软
件、深度访谈等方法。最终通过数据清洗、数据
集成、数据规约、数据变换等数据预处理方法,
将半结构化数据与非结构化数据转化为易于存储
2学术期刊用户画像标签体系创建
构建用户画像的核心工作是给用户贴“标
签”。标签是对釆集的用户数据进行挖掘、过滤
和分析,提取目标用户群的特征,高度精练特征
并进行标识的过程。用户标签是对用户某项特征
进行的抽象和概括,按照处理过程和获取方式划
分为事实标签、模型标签、预测标签三个层级。
通过对学术期刊用户元数据的清洗、转换等处理
从原始数据中提取事实标签,对其建立模型进行
计算获取模型标签,在此基础上通过聚类、分
类、关联规则、决策树、协同过滤等数据挖掘算
法得到预测标签,如图1所示。
第一步,统计分析。对原始数据进行统计分
表1学术期刊用户画像原始数据内容与采集方式
数据类型
基础信息数据
研究动态数据
行为偏好数据
社交互动数据
数据来源
学术期刊网站、期刊数据库、投稿
平台等
期刊数据库、学术期刊客户端
互联网搜索引擎、期刊数据库
期刊微信公众号、学术期刊客户
端、期刊数据库
主要信息
姓名、性别、学校(单位)、职业(专业)、职称、
出生曰期、居住地、联系方式
论文、著作、专利、科研项目
页面浏览频次、内容搜索关键词、登录时间段、使用
设备、订阅期刊、投稿记录
学术合作、导师、点赞次数、评论内容、转发次数
采集方式
用户注册信息导出
期刊数据库导出、爬虫
爬虫、期刊数据库导出
爬虫、期刊数据库导出
用户个人信息
丨以始数据
姓名
性別
中-位/•>':校
职称
研究动态
用户行为
登录时间
使用设备
汀阅购买
it
^
M
:
检索
投稿
i
己泌
社交互动
合作学#
合作期刊
W
-师
.•人
Ut
:转
i
己录
计分析
联系力式
G、lk
论
研
义
项
作
/;-
片
利
、
i
芑
U
_
AP
/^_
n
_
•
jf
实标签
研究方向
论文发表数址
懸▼
登录时长频次
设备使用频率
检尜主题及频次
设备使
HPJ
惯
ir
阅购
x
次数 1
点
if
妨次数
&作次数
科研项
Ei
名称
论文
K
栽
W
:被引
M
:
I
建模分析
A
.
UWf
»:
模魁标签
I
:法预测
研究偏好
学术研究活跃度
合作期刊影响力
稿⑭,_
汀阅购买偏好学术合作关系
An/4fi-;
预测标签
购尖能乃近期研究需求
续汀槪率 1
丄丨的竹丄对,_
tj
标合作期刊
图1学术期刊用户标签体系创建
科技与出版
I 2021
年第
2
期
析,提取事实标签。通过文本挖掘、主题抽取、数
据统计等方法,从原始数据中尽可能多地提取事实
标签。例如,在用户的研究动态数据中进行主题抽
取,得到论文主题、著作主题、科研项目主题、专
利名称等事实标签;对用户登录时间、检索记录、
订阅购买记录等进行统计计算,得到登录时长频
次、检索主题及频次、订阅购买次数等事实标签。
第二步,建模分析。以事实标签为基础,
通过建模分析,得到模型标签。采用回归法、决
策树等算法建模分析,进一步挖掘用户特征。例
如,通过对订阅购买次数、论文发表数量、论文
主题等建模分析,可以得到用户的期刊亲近度;
通过用户填写的单位、职称、科研项目经历,以
及对用户所发论文的被下载量、被引量等数据进
行建模分析,可以得到学术地位、学术研究活跃
度等标签,为之后的约稿、違选审稿人等提供参
考;通过对登录时长与频次、设备使用频率等进
行关联建模,可以得到用户的设备使用习惯、登
录时长分布等。以上信息均有助于学术期刊选择
相应时间及渠道向用户推送信息。
第三步,算法预测。在模型标签基础上,
利用预测算法,如机器学习中的监督学习、计量
经济学中的回归预测、数学中的线性规划等,对
用户近期科研需求、目标合作对象、期刊续订概
率、稿件录用概率等进行预测,从而实现期刊知
识服务的精准化、个性化和定制化。
3学术期刊的用户画像呈现
通过聚类算法将有相似特征的多个用户聚集
为用户群体,构建群体画像,例如作者画像、读
者画像和专家画像。
(1)作者画像。撰稿作者的专业、研究方
向、作者贡献度、近期发文数量、总被引频次等
ACADEMIC EXPLORATION |
学术探索
标签集合构成了作者用户画像,
tagCloud、Tagul
等工具可以直观呈现作者的发文状况,学术期刊
可以据此预测该作者可否为本期刊合作对象。例
如,
CNKI
中国引文数据库中设置的“作者分析
器”,包括作者名称、作者单位、发文量、各年
被引量等数据,以图表模式和数据模式两种可视
化方式呈现期刊分布和关键词排名。
(2) 读者画像。用户的搜索关键词、下载论
文关键词、订阅期刊、订阅次数、访问地址、关
注公众号等标签构成读者画像。学术期刊根据呈
现出的读者画像判断读者当前所处的科研阶段,
针对科研立项、论文选题、论文撰写、学术交流
等不同阶段为读者提供所需服务。
(3) 专家画像。学术影响力、学术关
络、学术研究活跃度、研究成果质量等标签构成
了专家画像。例如,中国知网推出的
CNKI
学者成
果库,包括基本信息、学术关注点、全部研究成
果、学术影响力分析、学术关系网络、所在领域
研究现状等,排序领域还有学者的发文数量、被
引频次、
H
指数、
G
指数等最新数据。通过专家画
像系统,学术期刊可以精准审稿和约稿以及相关
信息服务推送
D
4基于用户画像的学术期刊精准化知识服
务策略
4.1瞄准用户特征,服务模式精准化
一是学术期刊选题策划精准化。学术期刊可
以通过用户画像,分析用户搜索信息、下载内容
和引用的趋势,快速准确筛选热点研究方向,找
到有价值的内容,做出科研方向的决策;通过参
考用户的研究方向、研究兴趣,推送给作者最有
研究价值的学术研究热点
d
例如,
Elsevier
开发了
科研管理分析工具
SciVai
,通过可视化图表展示科
2021
年第
2
期|科技与出版
系网
学术探索
I ACADEMIC EXPLORATION
研机构以及科研人员的信息,如所属国家、研究机
构、研究方向、课题小组等,可为科研人员追踪研
究热点,识别全球科研动态,建立合作网络等1
二是学术期刊审稿的精准化。审稿专家的研
究方向经常根据研究热点而调整变化,研究内容曰
益细化和交叉,因此审稿人查找变得日益困难。国
外学术出版集团纷纷开发基于用户画像的智能审稿
专家系统,通过审稿专家画像的资源信息,自动统
计和汇总专家审稿时效,综合给出专家评分,并利
用对接论文的关键信息和研究领域,自动精准匹配
审稿专家,提高同行评议质量,实现智能遴选。
例如,
Elsevier
推出了审稿人认证平台
(Reviewer
Recognition
Platform
),为审稿人制作了包含审
稿记录的档案页面,方便大家精准找到相关领域的
学者以及发现评议中出现的问题。
4.2把握用户需求,服务内容多样化
学术期刊通过全面、精准、多维和动态的用
户画像体系对用户线上和线下行为进行深度洞察,
将元数据、模型、图表与网络平台、数据库、社
交媒体、移动端等类型数据集形成连接,实现用
户需求体验的精准对接,开发出图片、音频、视
频、数据库、知识库、知识解决方案等多模态的
内容产品。例如,
Elsevier
基于
ScienceDirect
和
Scopus
两大数据库满足用户的特定需求,通过数
据分析帮助出版机构进行决策。
Wiley
、美国科学
促进会等学术出版机构和
Kudos
平台进行合作,将
已经发表的论文通过作者补充添加的方式,生成论
文概述、论文宣传推广、实验数据、视频、图像
等辅助材料,分享至
、
等社交
媒体,或
ResearchGate
、
Academia
等科研社交平
台,极大提升科研成果的学术影响力。剑桥大学
出版社推出了数字平台---剑桥核心
(Cambridge
Core
),精准对接作者,提供全流程服务:通过
科技与出版丨
2021
年第
2
期
First
View
在线出版缩短出版周期,作者和编辑共
同商定出版细节,论文的
版本即时发送给作
者,论文发表后及时跟踪和评估文章的影响191。
4.3搭建用户网络,服务方式社交化
学术期刊根据用户画像中呈现出的用户活跃
度、学术合作关系和学术地位等,借助社交媒体
和学术期刊社群搭建用户关系网络,实现社交化
的知识服务。
一是打造学术期刊用户意见领袖。依据用户
画像呈现的学术地位、学术研究活跃度、与他人互
动程度等,打造学术期刊用户中的意见领袖,将同
类兴趣的研究用户凝聚在一起,借助意见领袖的学
术影响力,提升学术期刊知识服务的准确度。
二是运营学术期刊用户社群。根据用户的研
究领域、活跃程度,建立秩序良好、研究领域清
晰的知识学习社群。例如,《现代医药卫生》以
、微信等社交媒体建立的医学网络社群为基
础,打造了医学专业社群体系—“杏林医学平
台”,覆盖医学领域近30个学科专业,
群、微
信群数量近1 〇〇〇个,在线医务工作者达15万人,
成为我国西南地区最大的医生社交网络体系;期刊
编辑部通过杏林医学平台开展选题策划与调研、开
辟学术讲堂、对期刊优质论文进行二次传播|1C)1。
4.4细分用户标签,服务推送个性化
学术期刊在细分用户的基础上精细把握用户
多维标签,使得知识服务与学术期刊用户需求相匹
配,满足用户精准化知识服务。学术期刊可以根据
用户画像中的信息检索、浏览时长分布等判断用户
目前所处科研环节,在用户立项、资料搜集、论文
撰写、论文投稿、学术分享等不同环节向其推送所
需的信息和工具,实现不同层次、不同学科类型科
研用户的信息服务精准推送。美国罗斯蒙学院出版
项目主管
Hartmann
认为,出版商了解目标读者所
ACADEMIC EXPLORATION |
学术探索
107
需要的信息、喜好、阅读目的以及日常工作流程、
面临的问题和挑战等,是做好数字内容出版的基
本要求|
U
1
a
例如,加拿大知名出版服务公司
Trend
MD
的核心思想是“跨平台相关文章精准智能服
务”,
Nature
、
Science
等均与其建立合作,出版
商将
Trend
MD
插件安装在网站上通过算法自动向
读者精准推荐热点文章、学科前沿、编辑认为价值
高的文章和专题以及下载量高的文章1121。
5结语
大数据、人工智能和云计算技术带来了信
息内容、传播方式的变革,深入准确理解学术期
刊用户的信息需求,解决知识服务精准推送中的
用户“意图鸿沟”,用户画像技术与出版系统的
融合是学术期刊知识服务未来发展的必然趋势。
学术期刊只有及时把握并跟踪用户需求的不断变
化,基于用户网络关系环境,采集动态的、系统
的用户数据,通过数据挖掘、过滤与分析,提炼
用户特征,细分标签,最大限度地刻画用户画像
模型并建立数据库,才能更好地从海量科研数据
中匹配不同科研用户的知识资源需求和服务需
求,为学术期刊用户提供精准的知识服务。
参考文献
[1]
Techtrends
2024-
STM
[
EB
/0
L
], [2020-04-30].
https
://
www
.
stm
-
assoc
.
org
/
standards
-
technology
/
stm
-
tech
-
ti
"
ends
-2024-
focus
-
on
—
the
—
user
-
connect
—
the
—
dots
/.
[2]
MASSANARI
A
.
Designing
for
Imaginary
Friends
:
Information
Architecture
,
Personas
and
the
Politics
of
User
Centered
Design
[
J
].
New
Media
&
Society
, 2010,
12(3) : 401-416.
[3] 徐芳,应洁茹.国内外用户画像研究综述[
J
].图书馆
学研究
,
2020 ( 12) : 7-16.
[4] 余传明,田鑫
,
郭亚静,等.基于行为-内容融合模型
的用户画像研究[
J
].图书情报工作
,
2018(13) : 54-63.
[5] 盛怡瑾.用户画像技术在学术期刊审稿人遴选中的应
用[
J
].出版发行研究
,
2018 ( 8) : 54-58.
[6] 刘英.“互联网+”背景下学术期刊精准出版发展路径
研究[
N
].中国新闻出版广电报,2020-03-25 ( 004).
[7] 向飒.国外学术出版集团数字化和智能化发展现状及
我国对策建议[
J
].中国科技期刊研究,2019, 30 ( 7 ):
740-744.
[8] 陈振英,何小军.如何利用
SciVal
辅助学术期刊选题及
约稿[
J
].中国科技期刊研究,2020, 31 ( 7 ) : 809-815.
[9] 肖超.利益相关者视角下剑桥大学出版社学术出版服
务及启示[
J
].出版参考,2018 ( 11 ) : 29-32.
[10] 苏畅,毕丽,孙廷,等.专业社群与医学科技期刊
融合发展探索:《现代医药卫生》实践为例[
J
].中国科技
期刊研究,2017, 28 ( 11 ) : 1078-1082.
[11]
HARTMANN
T
V
.
A
Holistic
Approach
to
Digital
Content
PublishingER
].
New
York
:
Science
Press
, 2018.
[12] 谢曼,石应江,李哲,等
.
Trend
MD
内容推荐平
台:提升科技期刊国际影响力的新途径[
J
].编辑学报,
2017, 29 (
S
2) : 73-75.
(责任编辑:张昕)
2021
年第
2
期|科技与出版
发布者:admin,转转请注明出处:http://www.yc00.com/web/1711404602a1900127.html
评论列表(0条)