二、税收大数据的应用

[b](一)税收大数据技术[/b][br][br] 税收大数据技术是指对海量、巨量的涉税信息数据快速获取、存储、处理、分析、挖掘[br]的现代信息技术。目前所说的“税收大数据”不仅指数据本身的规模体量,同时包含税收大数据获取、存储、挖掘、分析及可视化应用的现代信息技术手段。税收大数据应用的目的是有效推进大数据技术应用到税收征管领域,通过涉税海量数据的获取、处理、分析挖掘和利用促进其突破性发展,更有力地推动税收征管数字化转型智慧税务建设。因此,税收大数据给广大税务人员带来的挑战不仅体现在如何获取、处理、分析、应用涉税海量数据,从中获取有价值的税收信息资源,也体现在如何有效推进税收大数据技术的研发及推广应用。税收大数据技术主要包括以下几种。[br][br] 1. 数据获取技术[br][br] 数据获取技术包括 ETL(Extract-Transform-Load)工具、网络爬虫技术等。ETL 是将数[br]据从来源端口,经过抽取(Extract)、转换(Transform)、加载(Load)至目的端的工具,负责将分布的、异构数据源中的数据,如关系数据、平面数据文件等抽取到临时中间层后再进行清洗、转换、集成,最后加载到数据仓库或者数据集中成为联机分析处理、数据挖掘的基础。例如,金税系统的决策一包到决策二包,就是运用数据抽取转换技术集成后,再开展进一步挖掘、分析和利用,有效完成决策系统的各项功能。[br][br] 2. 数据存储技术[br][br] 数据存储技术包括结构化数据存储技术、半结构化数据存储技术和非结构化数据存储技术。目前,税务系统积极拓展开发应用区块链技术基础架构、云存储、分布文件存储等技术,为有效推进智慧税务建设奠定坚实的数据基础。[br][br] 3. 数据处理技术[br][br] 数据处理技术是在进行数据分析前,对获取的原始数据进行的诸如清洗、填补、平滑、合并、规格化、一致性检验等一系列操作技术,目的是提高税收大数据的质量,为后期的数[br]据挖掘分析奠定良好基础。数据处理主要包括四个部分,分别是数据清理、数据集成、数据转换、数据规约。[br][br] 4. 数据统计分析技术[br] 数据统计分析技术主要包括假设检验、显著性检验、差异分析、相关分析、T 检验、均值与方差分析、离散度分析、回归分析、简单回归分析、多元回归分析、回归预测与残差分[br]析、logistic 回归分析、曲线估计、因子分析、聚类分析、主成分分析因子分析、聚类分析、判别分析、对应分析、bootstrap 技术、实时分析、图片识别语音识别等统计分析技术。[br][br] 5. 数据分析挖掘技术[br][br] 数据分析挖掘技术主要包括分类(classification)、聚类(clustering)、估算(estimation)、预测(prediction)、相关性分析、回归分析或关联规则(affinitygrouping or association rules)、描述分析、数据可视化(description and visualization)、复杂数据类型挖掘(Web 挖掘、图形图像、视频、音频处理)、人工神经网络模型与智能化、预测分析模型技术、估算分析模型技术、机器学习、仿真建模技术等。[br][br] 6. 数据可视化展现技术[br][br] 数据可视化展现技术是对税收大数据挖掘分析结果通过图像、图表、动画等方式的呈现[br]技术,是了解复杂数据、开展数据深入分析不可或缺的技术手段和方法。数据可视化技术能够迅速、有效地简化与提炼税收数据流,更直观地呈现税收大数据的特点、趋势和规律,通[br]过交互式视觉表现方式帮助税务人员探索和理解复杂的涉税数据,有助于更快、更好地从复[br]杂数据中得到分析结论及更新意见,就如同看图说话一样简单明了,更容易被税收管理人员[br]所接受。[br][br] 数据可视化主要有图表展示、文字展示、图像动画展示等不同方式。其中,图表展示方式应用更加广泛,包括散点图、折线图、柱状图、地图、饼图、雷达图、K 线图、箱线图、热力图、关系图、矩形树图、平行坐标图、桑基图、漏斗图、仪表盘等。
[b](二)税收大数据分析在税收治理中的主要应用[br][/b][br] 1. 税收形势分析[br][br] 税收形势分析是由收入规划核算部门牵头负责、其他业务部门配合开展的一项税收大数[br]据分析应用工作,主要通过计算宏观、中观和微观不同层面税收指标及相关分析方法,针对[br]一定时期内,一定区域、行业及纳税人不同范围内税收的总量规模、结构特点、质量及增减[br]变动趋势进行分析预测,客观反映税收的数量特征及发展变动趋势,剖析收入增减变化的原[br]因,查找组织税收收入、税收征管及经济运行中存在的问题,提出加强组织收入、税收征管[br]的建议及措施。[br][br] 2. 经济税源分析[br][br] 经济税源分析简称税源分析,根据分析的视角,在有些情况下又称为经济形势分析,主要通过计算宏观、中观和微观不同层面涉税经济活动指标及相关分析方法,针对一定时期内,一定区域、行业及纳税人不同范围内涉税经济活动的总量规模、结构特点、税源质量及增减变动趋势进行分析预测,客观反映涉税经济活动的数量特征及发展变动趋势,如某地区的国内生产总值、增加值的产业结构、社会消费品零售额、固定资产投资额等。通过开展税源分析,能够客观反映涉税经济活动的总量规模、结构、质量及增减变动等数量特征,涉税经济数据对税收产生的关联影响,查找税源管理中存在的问题,分析影响税收增减变化的主要原因,为更好地优化营商环境、完善税制、加强征管、促进经济税收协调高质量发展提供决策依据。[br][br] 3. 税收经济分析[br][br] 税收经济分析是站在税务机关的角度分析经济运行的变化及税收经济之间的关联影响关[br]系。通过有效获取税收大数据,运用税收经济分析指标,分析经济运行对税收的影响,同时[br]透过税收大数据反映经济运行发展状况及经济结构调整变化情况,反映税收与经济发展的协[br]调程度,查找税收征管中存在的问题,有针对性地采取加强税收治理的措施,为税制改革完[br]善、加强税收征管、组织税费收入、促进和推动经济、税收协调高质量发展提供决策依据。[br]税收经济分析是从税收视角观察和反映经济运行的状况,做好税收经济分析可以有效提升税[br]务机关的话语权。[br][br] 4. 税收风险分析[br][br] 税收风险分析是税收大数据应用的重要核心领域,是指围绕税收风险管理目标,依据掌[br]握的税收大数据,构建税收风险指标体系,运用大数据的量化模型及智能化现代信息技术,对潜在的税收风险进行分析识别,探究税收风险特征规律,寻找发现税收风险可能发生的区[br]域、行业、纳税人及具体的税收风险发生环节的过程,并对可能产生的税收风险进行预警预[br]测,为科学有效地防范规避税收风险,有效实施税收风险应对控制和排查提供具体的明确指[br]向和决策依据。税收风险分析可以从宏观、行业及微观不同层面范围开展和实施。[br][br] 5. 税收政策效应分析[br][br] 税收政策效应分析是从事前、事中和事后,密切跟踪税制改革和税收政策发展变动及实[br]施效果等情况,测算税收政策变动、减税降费政策实施等对税收和经济社会发展、产业结构[br]优化调整、动能转换等的定量影响,并提出进一步完善税收制度政策,进一步促进经济结构[br]调整优化、经济社会协调高质量发展的建议措施,充分反映税收对经济社会发展的重要调控[br]职能作用,发挥税收在国家治理体系和治理能力现代化建设中的积极促进作用。

Información: 二、税收大数据的应用