引言
利用文献计量学对政策文本进行解构、分析,是当下研究公共政策的新方向之一。中国知网中搜索“政策”+“计量”两个关键词,即可以找到相应内容的文章。收集围绕某一主题的所有政策文本,以时间序列分析对政策数量的走势分析、发文部门的占比分析、历年政策主题的剖析、分类后的政策走势分析等等基础分析方式结合到一起,即可获得这一主体历年的政策宏观图景。然而,如何更进一步,结合公共政策研究中的政策理论?本文在此简单梳理,并提出未来的愿景。
深入政策计量分析,四个关键步骤是必须的,下文会对第三部分展开较为详细的讲述。
一、选择感兴趣的领域。
二、确定恰当的视角。
三、有哪些分析方法。
四、结合分析结果给出结论与讨论。。
一、选择感兴趣的领域
研究领域这一点不必解说,但如何穷尽地搜索某一领域or某一主题的相关政策文本,着实是一项困难的工程。
需要注意的是:(一)当研究的主题小,那么将其涵盖的大主题的政策文本也应被搜集(如研究民族双语教育的主题时,我国历年的教育政策应被搜集,甚至1949年的《共同纲领》中也出现了关于民族地区使用少数民族语言文字的论述);(二)当研究主题是跨领域时,就需要同时搜集数个领域的政策文本(如研究大学生村官主题时,农业领域的政策文本收集是不可或缺的,组织部的发文也应被关注)。
一个较好的范例是《中国科技政策要目概览(1949-2010年)》 ,其中辑录了1949—2010年间我国的科技政策多达4700条。这对使用政策文本计量研究的学者们提供了很好的参考。
二、确定恰当的视角
不同的视角在同一政策文本中提取不同的信息,当然,视角与分析方法是相互配合的。通常的视角有:政策主题视角、发文机关视角、主要措施视角、执行标准视角、关键要素视角、政策工具视角、政策网络视角。
三、有哪些分析方法
1 发展历程分析
按照收集而来的政策文本所展现的特征,将这一政策的进展历程分为数个发展阶段。
2 简单政策数量变化分析
以时间为横轴对历年发文数量的分析,或基于发文部门分类的政策文本数量变化分析。
3 研究视角的分析
政策主题的占比分析。探索政府历年的关注点。
共词分析。
每个政策文本提取2-4个主题词(或关键词),通过词频统计分析,找出一组主题词(或关键词)在同一篇政策中出现的次数,发现这些词之间的亲属关系。共词强度越高,说明两个词之间关联越密切。什么是政策主题词?1988年颁布实施的《国家机关公文格式》,政策文献的主题词是表达文献内容、规范文献种类的核心词汇,其目的是便于对政策文献进行分类、存储和检索。1
但在党政机关公文格式(2012年新标准)中已将主题词格式要素删除。
- 聚类分析。
共词分析生成共词矩阵,对这个矩阵进行聚类分析,得到各个阶段的聚类结果,即呈现出发展各个阶段的不同特征,揭示政策变迁过程中政策主题的变迁。
4 政策变迁分析
政策文献计量研究中的政策变迁分析可以关注政策创新、政策接续、政策维持、政策终结等方面。
政策文献计量支持探讨政策变迁中的规律(常规的渐进式?非常规的激进式?)。
政策文献计量使得探索各地政策文本在时间序列上的政策趋同成为可能。
5 网络分析
对政策文本中提及的各实施主体进行网络分析,可挖掘出政策层面的府际关系、合作治理的信息。网络分析不失为政策网络予以量化的效应途径,如对颁布机构进行网络分析,计算网络的节点数、连接线、直径半径的路径长度、密度等。
6 关联分析/引用分析
关联分析
通过一些提示词,可以解析政策文献之间参照关系与知识扩散,体现出政策制定的基础和起点,又可以反映出政策意图的继承、发展和进步的脉络。2对政策扩散的定量研究也成为可能。引用分析。
政策文献计量学来自文献计量学(或信息计量学)。文献计量学关注文献之间的引用关系。但政策中的引用关系往往是一种行政依据,而且行政影响力较大的正常文献一般会更多地被引用。正因如此,探索政策文献分分布规律时,并不符合文献计量学中的三大定律(布拉德福定律、齐夫定律、洛特卡定律)并不适用于政策文献计量研究。3那么政策文献的分散规律如何?这有待进一步探究。
7 政策文献的增长/老化规律分析
在参考文献3中提到:结合文献计量学研究与现有实证数据,可以初步判断政策增长研究与结合了理性主义和渐进主义的混合扫描(Mixed Scanning)分析和间断均衡(Punctuated Equilibrium)框架存在对话空间,政策文献在一定时期呈现渐进增长,在某些特殊决策节点出现间断平衡,不同重要程度的政策增长速度有显著差异。3
可见对政策文献的增长老化规律分析的进一步深入,而已探索出更多的有趣的结论。另外,政策老化现象的量化分析,对于政策终结规律的探寻,也会有一定的帮助。
四、结合分析结果给出结论与讨论
一系列的分析后,结合最初所选的政策领域,就可以得到相应的结论。
展望
尽管提到了许多的分析方法,但如何在计算机技术成熟、数据挖掘与机器学习火热化的时代中,更深入地推进政策文献计量学的研究?如何利用文本挖掘中的众多经典算法,形成政策挖掘的一套体系?小白期待下一步的学习。
参考文献:
1 黄萃,赵培强,李江. 基于共词分析的中国科技创新政策变迁量化分析[J]. 中国行政管理,2015,09:115-122.
2 黄萃,任弢,张剑. 政策文献量化研究:公共政策研究的新方向[J]. 公共管理学报,2015,02:129-137+158-159.
3 李江,刘源浩,黄萃,苏竣. 用文献计量研究重塑政策文本数据分析——政策文献计量的起源、迁移与方法创新[J]. 公共管理学报,2015,02:138-144+159.
注:本文系原创,本人享有著作权,转载不受限制但不得篡改作者姓名及请注明出处,谢谢。
您好,请问政策2-4个关键词是自己主观提取吗?
您好,是看了参考文献中的论文简单总结得到的,不能作为依据。这篇博文写于3年前刚接触政策量化研究之时,后来我不再关注政策量化的研究了,“2-4个关键词”之说的观点缺乏严禁科学逻辑依据。在此推荐清华大学黄萃的著作《政策文献量化研究》一书,可作为系统学习政策量化的学习书目。(这么晚才看到,抱歉,希望谅解^_^)