• 文本挖掘在企业社会责任报告研究中的应用探析 不要轻易放弃。学习成长的路上,我们长路漫漫,只因学无止境。


      [择要]跟着经济社会的生长,企业被要求承当更多的社会责任,国度无关部门也制订了相干划定,要求企业披露社会责任讲演。社会责任的承当与讲演的披露有其法令根蒂根基,然而法令并无划定企业的社会责任使命的详细内容与讲演的披露。文章拟经由进程文本发掘技巧,探求社会责任讲演披露内容的特性,经由进程词频统计、共现剖析、语义网络剖析等进程探求披露内容关键词之间的联络。经由进程技巧的使用途径探求,以期为将来法令对企业社会责任内容的标准举行合理自创。   [关键词]文本发掘;企业社会责任;法令   [DOI]1013939/jcnkizgsc201719014   1媒介   跟着中国经济和社会的快捷生长,企业行为惹起的内部

    暮气

    暮气性问题和社会公共问题也逐步突出,为了增进经济、社会和协调可连续生长,国度无关部门增强了对企业的内部

    暮气

    暮气监禁,同时也要求企业严正自律,自动承当必然的社会责任并实时向社会讲演。愈来愈多的企业正以踊跃的姿态实行本身应承当的社会责任,而且在无关部门专门标准的指点下踊跃披露其实行社会责任情况的信息。从2006年中国企业社会责任的元年到2015年这十年,社会责任讲演的总量从32份增进到了1703份,实现了敏捷的增进。然而差别于企业的财政信息披露,社会责任披露具有自愿性、挑选性、低标准化等特性。能够预测将来法令对企业应承当的社会责任内容会有明白的标准,并对讲演披露的内容有着详细的要求,经由进程文本发掘技巧,发现目前企业社会责任讲演内容的特性,对将来标准的制订将会有必然的自创意思。   2企业社会责任   21观点界定   企业社会责任金字塔实际,其创建者卡罗尔(2000)以为,四责任模子实际上是好处相干者模子。第一层的经济责任是根蒂根基责任,对差别好处相干者的存眷各有着重,影响最大的是所有者和员工;第二层是法令责任,法令是社会关于可接收和不成接收行为的法例集成,法令责任是希冀企业依法运营;第三层是伦理责任,企业伦理责任意指企业有使命去做那些正确的、正大的、公平的事情,防止或只管淘汰对好处相干者的损害;第四层是慈祥责任,慈祥责任是寄望企业成为一位好的企业国民,希冀企业实行其慈祥责任,为社会生活品质的改良做出财力和人力方面的进献。[1]   22实际根蒂根基:社会左券论   1937年,被誉为“现代企业实际之父”的科斯在其《企业的性子》一文中开拓了以左券剖析企业征象的新思路,奠基了企业左券性子的实际根蒂根基。企业在运营运动进程中处置的关连是多方面的,一方面与员工、办理者等内部

    暮气

    暮气好处相干者缔结内部

    暮气

    暮气社会左券,另一方面与消费者、当局等内部

    暮气

    暮气好处相干者缔结内部

    暮气

    暮气社会左券,在这个意思上,社会左券实际为企业社会责任奠基了实际根蒂根基。乔治?斯蒂纳与约翰?斯蒂纳提出,“社会左券实际”是一种非常形象的观点,但它却暗含着企业所必需符合公共的希冀,左券次要是企业社会责任的一种扩大观点,由于它不加任何严正限度地增强了企业对许多社会要素的使命。[2]按照万博网,万博manbetx官方网站,水晶宫球衣赞助商左券实际,企业与多方缔结了一系列左券,企业社会责任也等于企业对好处相干者承当责任的综合体。左券在素质上等于一种法令,一种在特定人之间构成的特殊关连。能够说,企业的左券素质决议了企业社会责任具备法令属性。   23相干法令标准   2005年年底,国务院国资委发动的“中国企业社会责任同盟”正式成立,同时召开了“2005年中国企业社会责任论坛”,制订了海内第一部《中国企业社会责任标准》。2007年12月,国资委公布《关于地方企业实行企业社会责任的指点看法》,其中划定的关于地方企业实行的社会责任内部

    暮气

    暮气包孕坚持依法运营老实取信、不断提高连续盈利才能、其实提高产品品质和办事水平、增强资源节约和环境保护、推进自主创新和技巧进步、保障消费保险、维护职工合法权利、介入社会公益事业这个八个方面。承当社会责任已被写入法令,《中华人民共和国公司法》第5条第1款划定,公司处置运营运动,必需遵照法令、行政法例,遵照社会公德、商业道德,老实取信,接收当局和社会公共的监视,承当社会责任。但这宣言式的划定并无社会责任的详细内容。而且就立法而言,现在已有《公司法》《企业国有资产法》等几部经济法令作出了企业“承当社会责任”的原则性划定,但究竟还有哪些详细的制度是贯彻这一原则性划定的,目前人们还不是很明白,这方面的立法事情与解释事情还需求增强。[3]立法的事情来源于实践,企业自动承当的社会责任也会疏导立法事情者将来对企业社会责任的标准。企业社会责任讲演正式企业披露其承当责任的载体,经由进程研讨企业社会责任讲演,探求其责任内容、责任特性,对当前增强立法事情、疏导企业社会责任标准具有必然的参考意思。   3文本发掘技巧   31文本发掘的定义   “文本发掘”能够定义为一个学问密集型的处置进程,在此进程中,用户使用一套剖析对象处置文本集。与数据发掘相似,文本发掘旨在经由进程辨认和检索使人感兴趣的模式,进而从数据源中抽取有用的信息。[4]   32文本数据剖析作业进程   第一步是举行数据洗濯。数据洗濯包孕数据汇总与统计洗濯,数据可汇集来自差别数据库的差别万博网,万博manbetx官方网站,水晶宫球衣赞助商数据,通?^统计盘算以理解字段数据之间的关连水平及重复性,举行数据间的相互比对,能够经由进程专家举行协助校对。   第二步是树立根蒂根基辞汇语料库。对文本数据举行自动断词处置,能够从文章中自动深造断出常涌现的字词,也能够自定义、新增、修正

    休学与删除字词。用户能够汇入或裁减业余词库,强化及使用既有的语料库。之后,自动剖析及盘算辞汇在文本中的散布及其首要水平排序。   第三步是对文本数据举行分类与聚类。非布局化的数据可举行零碎自动聚类与半自动式分类,次要借由机械深造,以能正确树立非布局分类的观点种别与分类的原则。也可哄骗专家事先所定义的种别,经由进程相互间的差距树立分类原则。[5]   33文本发掘的使用   目前我国文本发掘研讨还处在消化吸收国外相干的实际和技巧与小规模实验阶段,尚未构成完整的适合中文信息处置的文本发掘实际与技巧体系。文本发掘技巧次要用于商业文档的分类、聚类、总结,次要表示在微博、在线评论等网页数据的主观性内容辨认、批驳情绪分类、经济代价发掘等几个方面。文本发掘在企业社会责任讲演、年度讲演、通知布告、法令文书等纯文本式文档中使用较少,无关畛域的研讨以至为空白。文章拟以文本发掘技巧,探求其在企业社会责任讲演剖析中的使用。   4文本发掘在企业社会责任中的使用探析   41材料来源   文章拔取了中国国际航空股份无限公司的2016年度企业责任讲演作为样本,来探求文本发掘技巧在企业社会责任讲演中的使用。中国国际航空股份无限公司,简称“中国国航”,在A股上市,股票代码为601111,第一大控股股东为中国航空集团公司,终极控制报酬国务院国资委。该讲演下载于中国国航官网,下载后的讲演为PDF格式,起首经由进程手工处置,举行TXT文本化,保存了文本局部。   42研讨对象   ROST Content Mining,简称ROST CM,内容发掘软件,是武汉大学沈阳教学研发的用以辅佐人文社会科学研讨的大型收费社会盘算平台。该软件能够实现微博剖析、聊天剖析、全网剖析等功效,用户遍及海内外100多所大学。本文使用的是该软件的分词、词频统万博网,万博manbetx官方网站,水晶宫球衣赞助商计、语义网络剖析等功效。   43剖析进程   431分词后构成高频词   将文本化后的社会责任讲演文档导入ROST CM软件,对文本内容举行分词。非布局化的文本经由进程分词切分后将会构成独立含意的词语。在分词前,设定企业社会责任讲演自定义词表,使一些业余辞汇不被进一步分词,包孕“企业社会责任”“社会责任”等,包管分词了局的正确,分词之后,最后失掉企业社会责任讲演高频特性词。将分词后的文档举行词频统计,失掉社会责任讲演词频表,能够失掉每一个词语涌现的频数(见表1)。摘取词频至多的前30个的词,失掉社会责任讲演文本高频辞汇表。能够看出公司名称“国航”是涌现至多的词;其次是“员工”“办事”“保险”“办理”与“游客”,能够以为该企业社会责任讲演存眷披露的内部

    暮气

    暮气重点在于职工与办理,内部

    暮气

    暮气内容在于办事、保险与客户。高频特性词表只能从最直观的涌现次数来观测出讲演所披露的内容,对披露内容关键词之间的联络则视察不出来,还需求进一步剖析。   432共现剖析   按照分词后统计的文本辞汇库,继续导入ROST CM软件,举行共现矩阵剖析。社会责任讲演关键词共现是指相反或差别特性的关键词共同涌现的征象,共同涌现的高频词之间具有着关连,关连水平能够经由进程共现频率来测量。由于篇幅无限,文章只拔取了频率前10的高频词,构建了10×10的共现矩阵(见表2)。能够看出,“晋升”与“办理”共同涌现了22次,“游客”与“办事”共同涌现了22次,表白讲演强调了公司要晋升办理,增强游客办事。经由进程共现剖析,能够看出相邻关键词间接共同涌现的频率,观测出讲演披露内容特性之间的关连水平。   433语义网络剖析   对关键词间接举行关连性剖析后能够进一步构建出学问舆图;共现剖析只能视察出关键词之间的间接联络,而社会网络则能够视察关键词之间间接与间接的关连性,以及相互之间的相干性强弱。经由进程共现矩阵导入到Ucient中,天生高频关键词共现网络。按照关键词之间关连的严密水平,经由进程Netdraw可视化软件导出企业社会责任讲演内容关键词语义网络(见下图)。经由进程关键词语义网络图能够看出,公司名称“国航”处于网络中心,“员工”“办事”“办理”“生长”“游客”等一系列名词关键词与动词关键词处于网络的第二层中心,一方面与内核“国航”联络,另一方面与外围“理念”“文明”“运营”等第三层关键词联络。第一层“国航”是讲演披露的主体,讲演披露的内容围绕着主体的一系列行为展开;第二层则是讲演披露的中心与纽带,披露出企业社会责任重点存眷的内容,一方面是“员工”“办事”等名词反映出讲演披露的差别模块,包孕员工权利、供应的航空办事、游客客户等,另一方面是“生长”“推进”“建设”“晋升”等一系列动词表清楚明了主体所举行的企业社会责任行为,联络了差别层次之间的名词内容;最外围的“代价”“运输”“培训”“环境”等关键词则是对披露内容的丰富与完满,涌现的次数较少,与其余关键词间接关连水平较低。关键词语义网络图   5了局与瞻望   目前,海内的企业社会责任还是以文献综述式、案例式、问卷调查式等方式举行研讨,以文本发掘、内容剖析法、数据发掘等形式的研讨较少。企业社会责任讲演披露的内容相对较多,内容浮现为非布局化的特性,经由进程盘算机量化,把非布局化文本转化为关键词并举行照应的剖析能够更主观地评估企业披露的社会责任的内容与特性。文章自创信息学科的文本发掘技巧,经由进程武汉大学沈阳教学开发的ROST CM软件,对企业社会责任讲演内容举行文本处置,经由进程分词把无序的文本处置为可剖析的辞汇,对辞汇举行统计失掉高频辞汇表,能够最间接视察出企业社会责任讲演披露的重点内容;对关键词进一步剖析,经由进程构建共现矩阵,能够视察出关键词共同涌现的频率,即视察出差别关键词的间接联络与关连水平;对共现矩阵进一步转化能够失掉关键词语义网络,经由进程学问舆图能够视察出关键词的间接联络与间接联络,而且能够视察出差别关键词间接的关连水平与严密水平。对社会责任讲演内容特性的探求,能够看出企业披露的其次要承当的社会责任,这对当前法令详细标准企业社会责任具有很大的参考意思。   文章还具有着良多缺乏

    不置可否,由于光阴和精力无限,只挑选了中国国航的企业社会责任讲演作为研讨对象,样本量繁多,后期能够挑选上市公司最近几年披露的讲演举行批量化研讨。文章只是探求了分词、?~频、共现矩阵、语义网络在企业社会责任讲演剖析中的初步使用,后期进一步的研讨还能够深入,比如经由进程关键词之间的联络与关连水平,探求差别要素之间的影响关连。别的,还能够经由进程文本发掘技巧中的聚类剖析,对关键词举行聚类,与国资委公布的地方企业应该披露的内容举行对比。经由进程这些进一步的研讨,以期能够探求文本发掘技巧在企业社会责任讲演研讨中的宽泛使用。   参考文献:   [1][美]阿奇?B卡罗尔,等企业与社会――伦理与好处相干者办理[M].黄煜平,等,译北京:机械工业出版社,2004:23-27   [2][美]乔治?斯蒂纳,约翰?斯蒂纳企业、当局与社会[M].张志强,王春香,等,译北京:中原出版社,2002:151   [3]程信和经济法视线下的企业社会责任[J].甘肃社会科学,2011(2):126-131   [4]程显毅,朱倩文本发掘原理[M].北京:科学出版社,2010:3   [5]谢邦昌,朱建平,李毅文本发掘技巧及其使用[M].厦门:厦门大学出版社,2016:15-18   [基金名目]本文系“地方高校根蒂根基科研营业专项资金”名目《基于文本发掘技巧的企业社会责任讲演研讨》的阶段性研讨成果。

    上一篇:以BOT投资方式促进西部基础设施建设

    下一篇:举重运动员:备战奥运 从吃饭抓起