云南警官学院学报 2012年第4期NO.4 2012 Joum ̄of Yunnan Police Ofifcer Academy 总第93期Sum93 博弈论视角下的警察职务犯罪预防 王宝志 (中国人民公安大学,北京100038) 内容摘要:本文将博弈论引人到对警务腐败问题的研究中,通过建立博弈模型,细致地分析了存在于警务人员、举 报者、罪犯各个主体之间可能的预期利益、行为模式,以及基于对不同行为模式的选择及各方主体的收益情况。最后. 文中提出了应对职务犯罪的建议及对策。 关键词:博弈理论;模型;警察职务犯罪 中图分类号:D917.6 文献标识码:A 文章编号:1672---6057(2012)o4—69—03 博弈论是以数学为基础,描述、分析多人决 道德的界限。原重庆市司法局局长文强案以及山 策行为的一种决策理论,是多个利益主体依据所 西省阳泉市公安局巡警大队队长关建军涉黑案 掌握的信息,在一定的约束条件下作出的多元决 等,均利用其职权便利与黑社会勾结,充当保护 策,决策的均衡结果取决于双方或多方的决策。 伞。打黑风波一石激起千层浪,国家基层警务人 简单地说,就是有关不同主体之间相互制约,并 员不仅没有效遏制黑恶势力,反而与其勾结,称 依据对方的行为作出选择的理论。目前,博弈论 霸一方,为非作歹多年却安然无恙,这不得不引 在生物学、管理学、经济学、国际关系、计算机 起人们的反思。 科学、政治学、军事战略和其他很多学科都有广 一、泛应用。除此之外,博弈论也为解决公安领域的 博弈论的基本要素 一些问题提供了方法论的指导,进一步拓宽了公 (一)局中人:在一场博弈中,有决策权的 安研究的领域,囚徒困境就是著名的博弈论之 参与者称为局中人,其决策都是为了实现自身利 一。本文将从公共经济学的角度探讨警匪串谋的 益最大化。先作出决策的一方叫做决策人,而行 经济风险与不可行性分析,并通过构建博弈论模 动滞后的一方称为对抗者,由于他依赖于决策人 型提出应对警察职务犯罪的策略和建议。 的决策进行选择,因此最终可能占优。在警匪串 随着市场经济的发展与改革开放的深入,市 谋的博弈中,局中人包括两方面的人员:一方为 场化、利益性已形成竞争的趋势。最初在商业领 警务人员,另一方为犯罪分子以及其同伙。 域,经济利益驱使着经济人行为,并成为竞争的 (二)策略:每个局中人都会依据已有信息 内在动力,近几年,政府领域已经引人了市场 选择实际可行的完整的行动方案,所有的策略构 化。新公共管理则认为商业领域的管理做法可被 成策略集。对警察而言,他可以根据当前工作环 政府机关所效法,刺激公务员的效益观,以提高 境、制度等选择与犯罪分子串谋,或者秉公守 行政管理的效能化,这是其积极的作用,但也出 法;嫌疑人也可以根据当前形势,趋利避害,采 现了违反道德与伦理的市场化行为。官商勾结, 取行贿执法人员、举报同伙等措施。 谋取利益的现象屡禁不止,公安系统也不例外, (三)得失:博弈结局时博弈双方的结果称 个别贪污分子被金钱冲昏了头脑,冒着巨大的风 为得失,它与局中人自身选择的策略以及所有局 险从事官商勾结的活动,利益的诱惑打破了伦理 中人所取定的一组策略都有关系。 收稿日期:2012—03—27 作者简介:王宝志(1986一),男,山东人,中国人民公安大学2010级公安情报分析方向研究生。 一69— 王宝志:博弈论视角下的警察职务犯罪预防 (四)次序:参与博弈的双方决策都有先后 之分,而且一个博弈方要根据对方的策略不止一 次的作出自己的决策选择,这样就出现了次序问 题,而且尽管其他要素相同,但次序不同,博弈 结果就会不同。 信息博弈是指参与人并非对所有其他参与人的特 征、策略空间及收益函数信息都有准确的了解, 在这种情况下进行的博弈就是不完全信息博弈。 《三国演义》中的空城计就是一个典型的信 息不对称的博弈案例,司马懿不知道自己和对方 (五)均衡:’是指相关量处于稳定值、平衡 在不同行动策略下的支付,而诸葛亮是知道的, 的意思,当一方实施某种策略后,对抗方会作出 反应而选择其他策略,这样双方的策略就构成一 个均衡。 博弈论中一个著名的理论是纳什均衡,它是 由一场博弈中所有参与人的最优策略构成的一种 战略组合,即在给定别人策略不变的情况下,没 有人有足够理由打破这种均衡,因为改变策略会 降低他的支付。从实质上说,这是一种非合作博 弈状态。纳什均衡涉及到博弈均衡偶的概念,所 谓“均衡偶”是指在博弈中,当局人甲采取其 最优策略a ,局中人乙也采取其最优策略b , 那么对于,V a∈A,V b∈B,有偶对(a,b ) 偶对(a ,b ) 偶对(a ,b),其中A、 B分别表示甲乙二人的策略集。 二、博弈的类型 博弈的分类根据不同的基准也有不同的分 类。一般认为,博弈主要可以分为合作博弈和非 合作博弈。合作博弈和非合作博弈的区别在于相 互发生作用的当事人之间有没有一个具有约束力 的协议,如果有,就是合作博弈;如果没有,就 是非合作博弈。 从行为的时间序列性,博弈论进一步分为静 态博弈、动态博弈两类。静态博弈是指在博弈 中,无论参与人是否同时作出选择,后行动者都 不知道先行动者采取了什么具体行动,著名的 “囚徒困境”便是静态博弈的例子;动态博弈是 指在博弈中,参与人的行动有先后顺序,且后行 动者能够观察到先行动者所选择的行动,例如棋 牌类游戏的行动是分先后顺序的,因此属于动态 博弈。 按照参与人对其他参与人的了解程度分为完 全信息博弈和不完全信息博弈。完全博弈是指在 博弈过程中,每一位参与人对其他参与人的特 征、策略空间及收益函数有准确的信息;不完全 一70一 他们对博弈结构的了解是不对称的,诸葛亮拥有 比司马懿更多的信息,当然,这种信息的不对称 完全是诸葛亮凭谋略制造出来的。在这里,诸葛 亮无论选择弃城还是守城,如果被司马懿知道, 那么诸葛亮均会被擒,唯一的办法就是不让司马 懿知道自己的策略结果。因此他使用空城计降低 司马懿进攻的可能受益,使司马懿误以为后退比 进攻是更好的抉择,而曹操与诸葛亮在华容道上 演的便是一场完全信息的博弈。 三、警察职务犯罪——警匪串谋的博弈论浅析 我们为本文开篇提到的案例所构建的博弈论 模型如下: 对于警务人员,秉公执法还是与犯罪团伙勾 结成为其保护伞,我们可以从经济学的博弈论的 角度进行反思。 表1警察与嫌疑人勾结与否的博弈论矩阵 B 嫌疑人 A A/B 行贿 不行贿 勾结串谋 ”+5.+5” ”十1O.一l0” 警察 秉公守法 ”4-1.一10” ”+1.一1O” 如表1,警务人员有勾结串谋与秉公守法两 种选择。用数字代表利益或者效应。假设罪犯或 非法活动的获利为lO,那么与其勾结,可以5-5 分成,但如果嫌疑人被抓,则国家没收所有利 益,罪犯的获利为一1O。警务人员如果秉公守 法,会得到荣誉的奖励,对其效应为+1。在罪 犯不予寻租而警务人员利用手中的职权进行勒 索、恐吓,甚至暴力夺取其不法收益的情况下, 警务人员得到了全部好处10而不需与其分成。 所以,无论罪犯行贿与否,警务掌权者都会选择 对他最有利的,即勾结串谋;而犯罪嫌疑人一般 会选择寻租行贿,因为不行贿则所有的好处都没 有,而行贿有可能遇到愿意与其串谋的警官。 王宝志:博弈论视角下的警察职务犯罪预防 表1的四种行动选择组合中, (串谋、行 贿)是帕累托最优的,因为偏离这个行动选择 若参与者举报主犯遭受的损失为一10,而本 组合的任何其他行动选择组合都至少会使一个人 的境况变差。不难看出,(行贿)是任一犯罪嫌 身所得利益消失并且受到牵连,损失为一5;如 果参与者不举报,参与串谋,所得利益为+5。 如果都秉公守法,肯定会得到荣誉,所以,从自 身利益最大化来看,参与者更倾向于不举报,除 非自身所得利益受到严重损害,比如内斗或者灭 疑人的占优战略,而(串谋、行贿)是一个占 优战略均衡。这就解释了为什么会经常发生监守 自盗的问题。例如在山西省阳泉市,巡警大队与 犯罪集团相互勾结,多年来在阳泉地区无视法 律,有组织地实施一系列犯罪活动,非法持有枪 支、弹药、寻衅滋事、聚众斗殴、扰乱社会秩 序、非法霸占矿产资源、收取保护费等,给当地 社会秩序造成了严重的危害。 口,导致比一5还多的损害。对于警察来说,如 果不举报,肯定会选择最大利益的勾结串谋;但 如果存在举报的可能,可能性大于50%,则会 选择秉公执法。所以,促进警务系统廉洁执法的 关键在于监督举报,只有这个可能性很大并且大 于50%的情况下,才会选择倾向于秉公执法。 以上分析的结果表明:如果警务人员串谋腐 警匪勾结自古有之,但是这种为虎作伥的事 情不能根除,可见监督体系存在巨大漏洞,权力 被无限放大了。阳泉市公安局相关人士称,关建 军只是一个分局巡警队长,本来就少有人关注。 败行为被发现并被追究刑事责任的平均概率能够 高于某一数值(该数值由各方的利益格局决 定),那么警匪串谋行为基本上就不会发生。从 博弈模型中也可以看到,内部人员不愿意举报的 加上“一级管一级”模式,下层民警所做之事, 上面不可能全部知道。不过,这种说法可能无法 成立。其实,最有价值也是最大的监督来源于体 系内,也就是同伙或者参与者的监督和举报。也 就是说,监督举报的人也很可能是串谋的参与 者。对于他们而言,除非利益受到严重威胁,否 则不太愿意举报,因为自身也受到牵连。表二是 对警务人员的行为以及举报者的行为进行分析。 表2警察与嫌疑人同伙的博弈论矩阵 同伙 A/B 勾结串谋 举报 ”一1O.一5” ”+1.+1” 不举报 ”+1O.+5” ”"4-1.+1” 主要原因是检举的成本太大,而警务内部监督检 举又是反腐倡廉、防止警匪串谋的关键,所以, 在政策上应该对检举的内部人员予以保护和给予 特殊照顾,例如记大功,物质奖励、免责等特殊 政策,让他们的举报成本大幅下降,并且举报利 益接近甚至超过不举报的好处,这样举报的概率 就会大大提高,从而有效地遏制警务人员利用职 权与黑恶势力勾结的发生。 警察 秉公守法 On the Police Crime Prevention from the Perspeetiue of Game Thory Wang Baoahi (Chinese People's Public Security University,Be ng,10038) Abstract:Game theory is introduced into the research of police corruption problem in this paper.With the establishment of game model,there will be a considerate analysis of the expected benefits,behavior pat— terns between each main body such as the police officer,the reporter and the offender,and also the income benefits from different behavior pattern will be included.Finally,this article puts forward the suggestion and countermeasure to deal with crimes. Key words:Game Theory;Model;Police Job—related Crime (责任编辑刘一敏) 71—