大翔吧 关注:39贴子:421
  • 14回复贴,共1
一、字符型分类汇总(一)简介
字符型分类汇总,就是对字符型分类变量进行求和、求平均数、求个数、求最大值、求最小值等的汇总。字符型分类变量主要是指代码表中的维度变量,如性别、部门、客户分类、材料分类、行业等,这是审计人员了解业务发生规律的视角。例如,业务发生交易按部门分类,分别计算各部门的收入与支出之和,从而可以对比各部门的收入和支出,了解各部门收支差异;对发票进行审计时,审计人员可以按月份进行分类汇总,将数量和金额加总求和,结果显示各月处理的发票数量和金额。此外,字符型分类汇总还可用于检查分类变量的合理性,而多个字段的分类汇总还助于发现数据异常分布,发现审计线索。
(二)Excel的字符型分类汇总
Excel有多种方法来实现分类汇总,本部分主要介绍Excel的分类汇总功能、SUMIF函数和数据透视表。
1.分类汇总功能
Excel提供了分类汇总功能,可以自动计算数据列表中的分类汇总值。
【例5.6】练习Excel分类汇总功能。数据源于“第五章数据/章节数据/第二节/发票表.xls”,按照供应商代码的分类字段实现对数量、金额的分类汇总,具体操作步骤如下:
(1)对分类汇总字段进行排序。点击【数据】→【排序】,选择【供应商代码】字段,按照字母升序排序。
【注意】在使用分类汇总之前,要保证数据清单的各列均有标题,每一列中包含同类数据,且没有空行或者空列。而且在分类汇总之前,要先按照分类汇总字段进行【排序】。
(2)点击【数据】→【分类汇总】, 在【分类字段】下拉列表中选择【供应商代码】选项,在【汇总方式】下拉列表中选择【求和】选项,在【选定汇总项】列表框中选中【数量】和【总额】复选框,如图5-24所示,点击【确定】,得到的汇总结果如图5-25所示。

图5-24 分类汇总界面
注意,分类汇总后的结果复制与粘贴。
2.利用SUMIF函数分类汇总
SUMIF函数是Excel常用的统计函数,实现数值范围内,符合指定条件的值求和。该函数的格式为:
SUMIF (Range,Criteria,Sum_Range)
Range为条件区域,用于条件判断的单元格区域;Criteria是求和条件,由数字、逻辑表达式等组成的判定条件;Sum_Range 为实际求和区域,需要求和的单元格、区域或引用,当省略该参数时,条件区域就是实际求和区域。
【例5.7】利用SUMIF函数实现分类汇总。数据同【例5.6】,从“产品代码”中提取 “产品大类”为分类字段,对发票表的“数量”和“总额”进行汇总,具体操作如下:
【注意】SUMIF函数的第一个参数的条件区域和第三个参数的求和区域,如果是具体的单元格地址,需要转换为绝对地址再向下拖放。
3.利用数据透视表实现分类汇总
数据透视表(PivotTable)作为Excel的强大利器,可以利用交互式的图表快速实现分类汇总,且灵活的行、列字段支持更多维度的分析与透视。
【例5.8】利用数据透视表实现分类汇总。

(三)Power Query的分组依据
Excel分类汇总功能仅可以实现单个字段的分类汇总,数据透视表可以实现行、列2个字段的分类汇总,这对于审计数据分析远远不够,本部分介绍的PowerQuery【分组依据】功能可以实现多字段的分类汇总。
【例5.9】利用Power Query实现多字段分类汇总,数据源同【例5.6】。在本案例中,按照“年份”、“供应商代码”、“产品大类”这3个分类字段进行汇总


IP属地:山东1楼2022-06-06 17:33回复
    (二)用Excel完成数值分层1.用VLOOKUP实现数值分层
    VLOOKUP函数可谓是Excel数据分析的“万能钥匙”,本教材在第四章曾用VLOOKUP函数实现代码转换,本部分将利用该函数实现数值分层分析,特别注意该函数第4个参数与第4章中的数据关联的差别,该函数的格式为:
    VLOOKUP (lookup_value,table_array,col_index_num,range_lookup)
    第4个参数range_lookup,只能是 TRUE(或1)/FALSE(或0或不填),分别表示模糊匹配和精确匹配,本部分的数值分层分析将利用第4个参数的模糊匹配。
    【例5.10】利用VLOOKUP实现数值分层,数据同【例5.6】,实现价格分层的开票金额统计,价格分层区间如表5-2所示,具体操作步骤如下:
    表5-2 “发票表”的价格分层区间
    阈值 区间
    0 0<=价格<100
    100 100<=价格<200
    200 200<=价格<300
    300 300<=价格<400
    400 400<=价格<500
    500 500<=价格
    2. 用数据透视表实现等距分层
    数据透视表可以实现数值型字段的等距分层,而VLOOKUP函数函数可以实现不等距分层,如上述的价格分层,利用数据透视表实现的效果。
    (三)Power Query的数值分层分析
    Power Query中没有直接的分层分析功能,实现方法有两种:一是通过添加条件列实现数值离散化;二是借助分层区间的辅助表,再利用合并查询功能关联来实现,本部分仅用条件列进行介绍。
    【例5.12】利用PowerQuery的条件列实现数值分层。


    IP属地:山东2楼2022-06-06 17:35
    回复
      (二)利用Excel的日期型分析 1.利用Excel函数
      利用Excel完成日期型分析,先利用DATEDIF函数计算出两个时间的间隔数值,再利用VLOOKUP函数计算这两个时间段的数值分层区间,最后利用时间分层区间实现分类汇总,即可达到账龄分析效果。
      【例5.13】利用Excel实现日期型分析,数据同【例5.6】。 在该例中,新增“截止日期”2002年3月1日,计算“发票日期”至“截止日期”的时间间隔天数,进而实现间隔天数的分层,最后依据分层区间实现对开票金额的分类汇总,操作步骤操作如下:
      (1)利用DATEDIF计算时间间隔。在Excel中,计算时间间隔时会用到隐藏的DATEDIF函数,该函数的格式为:
      DATEDIF(start_date,end_date,unit)
      第一个参数start_date,表示起始日期,第二个参数end_date,表示结束日期;第三个参数unit,表示所需信息的返回时间单位代码,“y”返回时间段中的整年数,“m”返回时间段中的整月数,“d”返回时间段中的天数。如图5-47所示,输入公式=DATEDIF(B2,C2,"d"),向下拖放,可计算所有记录的时间间隔天数。
      (2)建立时间间隔天数的区间表。在Excel中,输入表5-3 中的时间分层区间。
      表5-3天数间隔区间表
      阈值 区间
      0 1天至30天
      30 30天至60天
      60 60天至90天
      90 90天以上
      (3)用VLOOKUP函数实现与表5-3的模糊匹配。此步骤与【例5.10】相同,分层后结果如图5-48所示。
      (4)以间隔天数为分类变量,实现对“总额”的分类汇总,此步骤与字符型分类汇总相同
      (三)Power Query的时间间隔计算
      【例5.14】Power Query中日期型分析练习。在Power Query中,点击【添加列】→【常规】→【自定义列】,输入【自定义列公式】,如图5-51所示,后续操作可参照数值型分层操作,后述步骤不再重复阐述。


      IP属地:山东3楼2022-06-06 17:36
      回复
        (一)自动筛选
        Excel的自动筛选可以在数据清单中通过使用多列的一个或两个比较条件来查找数据行中的特定值。高级筛选的查询范围宽泛了很多,可以根据一列中的多个条件、多列中的多个条件,作为查询条件实现复杂筛选,返回查找中的特定值。
        【例 5.16】利用自动筛选查询凭证表中现金支出在10000元以上(包括10000元)的记录。数据源自“第五章数据/章节数据/凭证审计中间表-简化.xlsx”:
        1.点击【开始】→【编辑】→【排序和筛选】,使各列列标题右边出现筛选按钮,如图5-58所示。

        图 5-58“排序和筛选”界面
        2.设置筛选条件。选择【科目全称】为“现金”且“贷方发生额”大于等于10000的记录。单击【科目全称】右侧的筛选按钮,设置筛选条件为“等于现金”;单击【贷方发生额】右侧的筛选按钮,设置筛选条件为“大于或等于10000”,如图5-59所示。

        图5-59 设置自定义筛选条件
        点击【确定】后,再按照【贷方发生额】进行降序,审计人员可以了解该单位现金支出的具体情况。
        (二)高级筛选
        Excel的高级筛选需要设定【条件区域】,并在应用中指明【条件区域】所在位置。高级筛选中涉及的条件区域示例。

        如果同一列中包含多个条件参数,表示并列的逻辑“或”,如果同一行中包含多个条件参数,表示交叉叠加的逻辑“与”,如果条件区域包含多行多列,参照上述规则则进行复杂组合。还需要注意条件区域至少包含两行,在默认情况下,第一行作为字段标题,第二行作为条件参数。
        【例5.17】利用高级筛选检索出涉及大额现金(1000以上)及银行存款(10000以上)的记录。数据源自“第五章数据/章节数据/凭证审计中间表-简化.xlsx”,以下为具体操作步骤:
        在Excel空白区域设置条件区域,如:我们选取凭证审计中间表的P1:Q3区域,条件区域设置如图5-61所示。

        图5-61 设置条件区域


        IP属地:山东5楼2022-06-06 17:37
        回复
          三、Power Query关联查询
          上述Excel单表查询是针对一个表设置各种查询条件,有时审计人员设置的业务规则涉及多个表的关联与比对,此时Power Query的合并查询功能就显得更加方便,该功能曾在第三章第四节介绍,以下运用3个案例进行介绍。
          (一) 实现自关联的凭证查询
          基于本部分第四章U8凭证表结构介绍,一张完整的凭证至少包括2条记录,一条表示借方发生额,另一条表示贷方发生额,因此【例5.16】、【例5.17】中的单表凭证筛选后的结果仅是不完整的凭证记录,下面介绍如何利用PowerQuery的合并查询功能实现相对完整凭证查询操作。
          【例 5.18】利用Power Query的检索赊销收入的记账凭证,数据源于“第五章数据/章节数据/凭证审计中间表-简化.xlsx”,同【例5.16】,以下为本案例的分析思路和步骤。
          赊销收入记账凭证的常用格式为:
          借:应收账款
          贷:主营业务收入
          应交税费——应交增值税(销项)
          赊销收入涉及应收账款、商品销售收入和销项税额至少3条记录,因此要获得完整的凭证信息,需要利用【合并查询】功能实现凭证表的自连接,结合会计科目代码进行查询。在本案例中,因为分录有3行,进行了3次凭证表的复制、粘贴,分别命名:“商品销售收入表”、“应收账款表”、“销项税表”,进行凭证表的关键词进行表连接。请看操作视频:
          (二) 基于业务规则的凭证查询——以生产成本审计为例
          本案例系审计署培训案例,介绍了基于凭证记账规则的审计业务查询,以发现审计线索。
          【例 5.19】利用Power Query实现特殊审计业务规则查询,数据源“第五章数据/章节数据/某工业企业会计数据.xls”。
          对生产成本的审计是企业审计的难点之一。本案例中凭证表的“原材料”会计科目发生额中记录了所有辅助材料的详细记录。审计人员根据卷烟企业的生产特点,选择具有固定单耗定额,与企业生产流程相关性不强的辅料如烟箱、条盒、烟盒等作为分析的对象,发现一些线索。该企业产成品与烟箱、条盒、烟盒定额消耗的数量关系如下: 1大箱/5小箱/ 250 条盒。该比例关系表示:该烟厂的条盒消耗数量与产成品的数量存在着一个固定比例关系250 : 1 ,每50条烟作为一小箱,5个小箱成为一大箱,每一大箱作为一个计量单位进行产成品入库。如果该比例稍微高于250,可以理解为一定量的损耗,高出太多或低太多都表示存在问题。
          本案例数据源包括PZFILE和KMFILE两张表。KMFILE是该公司的科目代码表,主要关键字:KMBH(科目编号)、KMMC(科目名称)、DC(借贷方向)。PZFILE是该公司一年的凭证发生记录,主要关键字:KMBH(科目编号)、PZH(凭证号)、PZLB(凭证类别)、DC(借贷方向)、DFKMBH(对方科目编号)、SL(数量)、JE(金额)、MONTH(月份),凭证表可以利用KMBH为关键词,实现科目名称的关联。
          本案例需要4大步骤,第1步将PZFILE表中增加“科目名称”列,方便查询;第2步利用凭证记账规则生成各月辅料耗用统计表;第3步,利用凭证记账规则生成各月产量统计表;第4步,计算各月产量与辅料耗用的比例:产品单耗=辅料耗用数量 / 产量。为更好保存原始数据,先复制、粘贴整理好的PZFILE两次,以下为详细操作步骤。
          (三)多表关联对比的审计查询案例
          本案例仍为审计署培训案例,以海关审计为背景,利用外部数据与内部数据的关联关系来构建个体分析模型进行分析验证,查找海关已放行但未报关的问题。本案例利用Power Query的【合并查询】的【左反】连接类型功能实现。
          【例5.20】利用内外数据对比实现审计业务规则查询。数据源于“第五章数据/章节数据/关联对比-海关出口数据.xlsx”。
          本案例数据源包括:主表_放行数据和主表_进口报关单表头。主表_放行数据是审计人员取得的当地海港和空港的放行数据,已经过数据整理生成的中间表,关键字段有:报关单号、提单号;主表_进口报关单表头是海关内部提供的,关键字段有:海关编号、提单号或运单号。审计人员利用放行数据与海关内部的报关单数据之间高度一致的关联性,查找放行数据表中既无报关单号的业务,具体操作步骤请看视频。


          IP属地:山东6楼2022-06-06 17:37
          回复
            6


            IP属地:山东来自Android客户端10楼2022-06-06 17:40
            回复
              **孙艺轩


              IP属地:山东来自Android客户端11楼2022-06-06 17:40
              收起回复
                一. 单选题(共6题)1. (单选题)指标对比分析在本门课中属于下列( )概念范畴。
                A. 审计分析模型
                B. 审计分析方法
                C. 审计分析技术
                D. 审计分析工具
                我的答案: B正确答案: B2. (单选题)利用教材中的“用友数据”中的余额表中的资产利润率是( )
                A. 10.8%
                B. 13.8%
                C. 5%
                我的答案: B正确答案: B3. (单选题)EXCEL中【趋势分析】用的是( )方法。
                A. 回归法
                B. 时间序列法
                C. 平滑法
                我的答案: C正确答案: C4. (单选题)计算机辅助审计人员查询现金支出大于1000的记账凭证,这主要是运用下列哪种思路构建个体分析模型( )
                A. 利用法律法规构建个体分析模型
                B. 利用数据钩稽关系构建个体分析模型
                C. 利用业务处理逻辑构建个体分析模型
                D. 利用审计经验构建个体分析模型
                我的答案: B正确答案: D5. (单选题)Excel中【分类汇总】可实现( )字段类型的分类汇总?
                A. 数值型
                B. 字符型
                C. 日期型
                D. 逻辑型
                我的答案: B正确答案: B6. (单选题)EXCELBI在本门课中属于下列哪个概念的范畴()
                A. 审计分析模型
                B. 审计分析方法
                C. 审计分析技术
                D. 审计分析工具
                我的答案: D正确答案: D二. 多选题(共9题)7. (多选题)以下有关EXCEL排序( )是正确的?
                A. 利用RANK函数实现排名
                B. 可以实现多关键词排序
                C. 排序时最多有三个关键字
                D. 可以实现自定义排序
                我的答案: ABCD正确答案: ABCD8. (多选题)字符型结构分析可以利用Excel( )技术。
                A. SUMIF函数
                B. 分类汇总功能
                C. PowerQuery【分组依据】
                D. 数据透视表
                我的答案: ABCD正确答案: ABCD9. (多选题)本章第3节Excel数值型分类分析,应用了( )技术。
                A. VLOOKUP函数
                B. PowerQuery中的【条件列】
                C. 数据透视表
                我的答案: ABC正确答案: ABC10. (多选题)本章第3节Excel数值型字段结构分析,有关VLOOKUP函数正确的是( )。
                A. 应用精确查询
                B. 应用模糊查询
                C. 第4个参数为0
                D. 第4个参数为1
                我的答案: BD正确答案: BD


                IP属地:山东12楼2022-06-06 17:43
                回复
                  我宣布今天是我们占领大翔吧的日子


                  IP属地:山东来自Android客户端15楼2022-06-06 17:46
                  回复
                    一. 单选题(共4题)1. (单选题)按照审计数据粒度的划分,余额表属于()。
                    A. 明细数据
                    B. 汇总数据
                    C. 以上皆不是
                    我的答案: B正确答案: B2. (单选题)以下()不是评价数据质量最主要的指标。
                    A. 准确性
                    B. 完整性
                    C. 一致性
                    D. 可查询性
                    我的答案: D正确答案: D3. (单选题)Power Query中的6种关联,()与VLOOKUP实现效果一样的代码转换结果。
                    A. 左外部
                    B. 右外部
                    C. 左反
                    D. 内部
                    我的答案: A正确答案: A4. (单选题)凭证审计中间表的客户编码、供应商编码、部门编码、职员编码是会计数据中,经常出现的辅助核算编码,你认为这些编码应该保留,还是清理掉?
                    A. 保留
                    B. 清除
                    C. 不一定,看审计目标要求
                    我的答案: C正确答案: C二. 多选题(共3题)5. (多选题)下列属于数据验证操作的是()
                    A. 验证一级科目年初余额是否相等
                    B. 验证凭证是否有缺号
                    C. 验证管理费用的招待费是否合理
                    D. 验证总账的借贷方发生数是否相等
                    我的答案: ABD正确答案: ABD6. (多选题)审计数据预处理包括()。
                    A. 数据转换
                    B. 数据清理
                    C. 数据处理
                    D. 数据验证
                    我的答案: ABD正确答案: ABD7. (多选题)审计数据清理工作包括以下()。
                    A. 消除冗余数据
                    B. 修改错误值
                    C. 替换空值
                    D. 保证数据值落入定义域
                    我的答案: ABCD正确答案: ABCD三. 判断题(共4题)8. (判断题)数据转换是进行计算机数据审计必不可少的工作。
                    A. 对
                    B. 错
                    我的答案: 对正确答案: 对9. (判断题)数据验证贯穿于审计各个阶段,应该将不同阶段的具体情况,采用适当的数据验证方法。
                    A. 对
                    B. 错
                    我的答案: 对正确答案: 对10. (判断题)审计数据验证与数据转换、数据清理经常交叉进行,没有规定的先后次序之分。
                    A. 对
                    B. 错
                    我的答案: 对正确答案: 对11. (判断题)VLookup函数要返回的列可以不在第二个参数所表示的区域中。
                    A. 对
                    B. 错
                    我的答案: 错正确答案: 错


                    IP属地:山东17楼2022-06-06 17:49
                    回复
                      一、 审计中间表分类
                      审计人员通常结合被审计单位的经济业务特点,创建审计中间表。按照发挥的作用,分为基础性中间表和分析性中间表。
                      (一)基础性中间表
                      基础性中间表是审计人员结合被审计单位的业务性质和数据结构,依据不同的分析主题生成。所有基础性中间表的集合就构成了该审计项目的审计数据库,包括了所有与审计目的相关,能够为审计人员分析提供方便的数据集合。审计人员基于审计分析需求,主要被审计单位的数据库中生成基础性中间表。
                      (二)分析性中间表
                      分析性中间表是在基础性中间表之上,根据具体审计目标而生成。它是面向审计项目组中特定审计人员的,支持具体审计事项的分析而生成的数据表。
                      简单理解,基础性中间表是面向审计项目组全体审计人员的,而分析性中间表是面向具有不同分析目的的相关审计人员。在本节下述案例中,主要介绍会计数据基础性中间表的设计与创建步骤。
                      二、审计中间表特点
                      1.体现业务特征。2.面向分析主题。3.保持相对稳定。
                      基础性审计中间表通常具有较为固定的结构。例如,会计数据中的余额表关键字段有:会计期间、会计科目、本期期初余额、借方发生额、贷方发生额、期末余额,较少发生变化。
                      三、审计中间表创建步骤
                      (一)根据业务性质划分数据类别
                      审计人员在全面了解和熟悉被审计单位经济业务的基础上,按照业务性质进行审计中间表的类别划分。例如,审计人员采集了被审计单位完整的ERP数据库,了解到该单位启用了财务、采购、销售、存货、报表、工资等模块,可以按照ERP模块的经营业务划分审计中间表类别。
                      (二)获取数据字典,抽取关键表
                      被审计单位的数据库设计说明书或数据字典,以及信息系统开发过程中形成的技术文档,是审计人员了获取表间关系的重要资料。在这些技术文档中,记录了数据库的总体结构、数据库分类、数据库中表间关系的说明、表结构等,审计人员依据这些资料对上一步骤的业务类别进行进一步细分。
                      (三)设计主表
                      从源数据库中选择反映该类别经济业务的主要字段,重新组织这些字段,设计主表。设计主表的过程包括表间关联关系、整合数据和选择字段三个步骤。
                      (四)代码表
                      如果主表的某些字段是一些代码,则需要结合代码的含义及其层次结构,设计代码表,例如客户代码、供应商代码等,但无须对订单编号、凭证编号等字段进行设计。
                      (五)补充表(六)使用说明四、审计中间表设计—以U8凭证表为例(一)审计关注的会计数据表
                      用友U8的会计数据相关表名称
                      原始表名 汉化后表名 表的类别 原始表名 汉化后表名 表的类别
                      Gl_Accvouch 凭证表 事实表(主表) Vendor 供应商表 代码表
                      Gl_Accsum 余额表 事实表(主表) Person 个人表 代码表
                      Gl_Accass 辅助余额表 事实表(主表) Department 部门表 代码表
                      Code 科目代码表 代码表 Customer 顾客表 代码表
                      (二)凭证表的关键字段
                      GL_accvouch表的主要字段及涵义
                      序号 字段名 类型 说明
                      1 iperiod 整型 会计期间,值范围1-12
                      2 csign 字符型 凭证类型
                      3 isignseq 整型 凭证类型排序号
                      3 ino_id 整型 凭证号
                      3 inid 整型 行号
                      4 dbill_date 日期型 制单日期
                      5 cbill 字符型 制单人
                      6 ccheck 字符型 审核人
                      7 cbook 字符型 记账人
                      8 ibook 整型 是否记账
                      9 ccashier 字符型 出纳人
                      10 iflag 整型 标志:null_有效凭证;1_作废凭证;2_有错凭证
                      11 cdigest 字符型 摘要
                      12 ccode 字符型 科目编码
                      13 md 数值型 借方发生额
                      14 mc 数值型 贷方发生额
                      15 ccode_equal 字符型 对方科目
                      16 cdept_id 字符型 部门编码
                      17 cperson_id 字符型 职员编码
                      18 ccus_id 字符型 客户编码
                      19 csup_id 字符型 供应商编码
                      20 citem_id 字符型 项目编号
                      21 citem_class 字符型 项目大类编码
                      (三)多张代码表的关键字段
                      凭证表中不仅包括摘要、日期、编号、科目代码、借方金额、贷方金额等基本信息,还有该凭证表的辅助字段。其中,科目代码(ccode)字段需要关联科目代码表(code)表中的(ccode)字段,才能取到会计科目名称。如果某一会计科目设置了客户辅助核算(U8中最基本的5项辅助核算有客户、部门、个人、供应商、项目),那么凭证中的客户编码(ccus_id)需要与客户表进行关联,才能知悉该客户的名称、分类等详细资料。因此,为得到完整的凭证审计中间表,需要与科目代码表、部门表、个人表、客户表、供应商表等代码表进行关联。
                      科目表(code)关键字段
                      序号 代码表字段 对应原始字段名 类型
                      1 自动编号 i_id 整型
                      2 科目类别 cclass 字符型
                      3 科目代码 ccode 字符型
                      4 科目名称 ccode_name 字符型
                      5 科目层级 igrade 整型
                      6 是否末级单位 bend bit
                      部门表(Department)的关键字段
                      序号 代码表字段 对应原始字段名 类型
                      1 部门编码 cDepCode 字符型
                      2 部门名称 cDepName 字符型
                      职员表(Person)的关键字段
                      序号 代码表字段 对应原始字段名 类型
                      1 职员编码 cPersonCode 字符型
                      2 职员姓名 cPersonName 字符型
                      3 部门编码 cDepCode 字符型
                      客户表(Customer)的关键字段
                      序号 代码表字段 对应原始字段名 类型
                      1 客户编码 cCusCode 字符型
                      2 客户名称 cCusName 字符型
                      3 发展日期 dCusDevDate 日期型
                      供应商表(Vendor)的关键字段
                      序号 代码表字段 对应原始字段名 类型
                      1 供应商编码 cVenCode 字符型
                      2 供应商名称 cVenName 字符型
                      3 发展日期 dVenDevDate 日期型
                      (四)凭证审计中间表
                      设计完成的中间表和各代码表的关系,如下图所示。

                      凭证审计中间表
                      序号 中间表字段 对应表名 对应原始字段名 类型
                      1 会计年度 Year 可依据需要,从“会计期间”提取 字符型
                      2 会计期间 GL_accvouch iperiod 数值型
                      3 凭证类型 GL_accvouch csign 字符型
                      4 凭证编号 GL_accvouch ino_id 整型
                      5 凭证行号 GL_accvouch inid 整型
                      6 制单日期 GL_accvouch dbill_date 日期型
                      7 摘要 GL_accvouch cdigest 字符型
                      8 科目编码 GL_accvouch ccode 字符型
                      9 科目名称 code ccode_name 字符型
                      10 借方发生额 GL_accvouch md 数值型
                      11 贷方发生额 GL_accvouch mc 数值型
                      12 部门编码 GL_accvouch cdept_id 字符型
                      13 部门名称 Department cdepname 字符型
                      14 职员编码 GL_accvouch cperson_id 字符型
                      15 职员姓名 Person cpersonname 字符型
                      16 客户编码 GL_accvouch ccus_id 字符型
                      17 客户名称 Customer ccusname 字符型
                      18 供应商编码 GL_accvouch csup_id 字符型
                      19 供应商名称 Vendor cvenname 字符型
                      20 对方科目编码 GL_accvouch ccode_equal 字符型
                      21 制单人 GL_accvouch cbill 字符型
                      22 记账人 GL_accvouch cbook 字符型
                      23 审核人 GL_accvouch ccheck 字符型


                      IP属地:山东19楼2022-06-06 17:51
                      回复
                        第四节 审计数据转换
                        本节主要介绍审计数据转换的内容和相关操作。
                        一、审计数据转换的内容
                        审计数据转换包括两方面的内容,一是将采集到的不同类型的数据转换为常用的数据格式,即数据表格式转化;二是明确地标识出每张表以及每个字段的经济含义,即数据表内容的转换。
                        (一)数据表格式转换
                        在我国政府审计的工作中,审计人员通常是根据采集到的不同格式的数据文件,分别运用多种方法将其装载到审计人员使用的SQL Server数据库中,并用SQL进行处理和分析。对于民间审计和内部审计的审计人员而言,SQL仍具有一定难度,更趋向应用审计软件或Excel进行分析。此部分操作与第三章数据采集操作类似,不再进行详细介绍。
                        (二)数据表内容转换
                        审计数据分析过程中,会遇到迥然相异的多个信息系统,例如不同财务软件有不同的数据存储规则:
                        1.同一字段在不同的应用中具有不同的数据类型。例如,字段“借贷方”在A应用中的类型是“字符型”,取值为“ Credit/Debit”,在B应用中的类型为“数值型”,取值为“0/1”,在C应用中的类型为“布尔型”,取值为“True/False”,在U8中没有该字段标志,因借贷金额是分别存放在2个字段中。
                        2.同一字段在不同的应用中具有不同的名字。例如,发生额在A应用中的字段是“balance”,在B应用中的名称为“bal”,而在C应用中又变成了“currbal”;
                        3.同名字段具有不同的含义。例如,字段“月折旧额”在A应用中表示为用直线折旧法提取的月折旧额,在B应用中表示为用加速折旧法提取的月折旧额;
                        4.同一信息在不同的应用中有不同的格式。例如,字段“日期”在A应用中的格式为“YYYY-MM-DD”,在B应用中的格式为“MM/DD/YYYY”,在C应用中的格式又为“DDMMYY”。
                        5.同一信息在不同的应用中有不同的表达方式。例如,对于借贷方发生额的记录,在A应用中设计为“借方发生额”与“贷方发生额”两个字段,在B应用中设计为“借贷方标志”与“借贷方发生额”两个字段。
                        二、审计数据转换的方法
                        常用的数据表内容转换方法有:
                        1.字段汉化。字段汉化就是明确标出每张表、每个字段的经济含义。通常,从被审计单位采集到的数据其字段名称不用汉语标注,而是采用系统内部的英文字段或英文简称表示,不便于审计人员对各字段经济含义的把握。
                        2. 数据类型转换。由于每次采集时的设备及条件所限,使得每次所采集的信息不一定满足分析的要求,需要对某些字段进行数据类型转换。数据转换的前提是类型相容,类型相容指的是一种类型数据的值域可以通过常用的转换函数映射到另一种类型的值域上,这种映射不会丢失数据的精确度。
                        3.代码转换。从被审计单位采集的原始数据库后含有大量的原始代码,例如,U8中的会计科目、部门、职工、客户、供应商等信息在凭证表中只是用代码来表示,甚至记账方向和部分较规范、常用的摘要也用代码来表示,不便于审计人员分析使用。因此,必须把这些代码转换为审计人员易理解、有意义的字段。
                        4.金额格式转换。不同财务软件存储凭证借贷的方式不完全一致,例如,对于借贷方发生额的记录,在A应用中设计为“借方发生额”与“贷方发生额”两个字段,在B应用中设计为“借贷方标志”与“借贷方发生额”两个字段,需要统一转换成为审计标准表中的格式。
                        5.数据长宽格式转换。有时被称为数据塑型。

                        三、审计数据转换的操作
                        (一)字段汉化

                        (二)数据类型转换
                        Excel的数据类型有:文本类型、数值类型、日期类型、逻辑类型。文本类型就是平常所输入的汉字、空格、英文字母;数值类型:数值型就是百分数、会计、科学计数等;逻辑类型就是True和False;日期类型就是常见的日期、时间等。注意, Excel把1900-01-01认为是第1天,即日期存储的是自1900-01-01那天后的第几天,实际上存储为整数类型。Excel的类型转换方法有多种,PowerQuery类型转换更为方便、直接。
                        Excel的字段类型转换
                        (1)利用分列功能转换

                        (2)强制类型转换,利用*1,或 “&”实现数值与字符型的转换
                        (3)Excel字符型转为日期型。Excel默认的日期型格式有“yyyy/mm/dd”、“yyyy-mm-dd”两种形式。Excel中字符型转换为日期型有以下常见方法:①通过“分列”功能实现在“分列向导”中的【列数据格式】选择“日期”型;②利用TEXT()函数,将数据转为“yyyy-mm-dd”格式,如【例4.3】示例;③利用“&”字符串连接符,将年月日用“-”或“/”连接,转为Excel默认的日期格式;④利用DATE()函数,将字符型的年、月、日参数转为日期格式。
                        2.PowerQuery的类型转换

                        (三)代码转换(重点)
                        VLOOKUP函数
                        VLOOKUP函数在Excel数据分析中占有重要地位。该函数功能是在表格或数值数组的首列查找指定的数值,并由此返回指定列处与该数值同一行的数值,主要语法参数如下:
                        VLOOKUP (lookup_value,table_array, col_index_num, range_lookup)

                        2.Power Query 的【合并查询】

                        Power Query“合并查询”中上面的表为左表,下面的表为右表。
                        左外部:左表的所有行,右表的匹配行。此例使用左外部连接,“科目余额表”中所有行都将保留,没有匹配项的行匹配空值(null)。
                        右外部:右表的所有行,左表的匹配行。若此例使用右外部连接,“科目代码表”中所有行都将保留,没有匹配项的行匹配空值(null)。
                        完全外部:保留两张表中的所有行,左右表互相匹配。若此例使用完全外部连接,“科目代码表”和“科目余额表”中所有行都保留并互相匹配,没有匹配项的行匹配空值(null)。
                        内部:内部=左外部(右外部)去空,仅留下匹配的行,没有匹配项的行不显示。若此例使用内部连接,“科目余额表”中有匹配项将保留,没有匹配项的行将删除。
                        左反:左反=左外部取空,显示左表中没有匹配项的行,不显示有匹配项的行。若此例使用左反连接,“科目余额表”中没有匹配项将保留,有匹配项的行将删除。
                        右反:右反=右外部取空,显示右表中没有匹配项的行,不显示有匹配项的行。若此例使用右反连接,“科目代码表”中没有匹配项将保留,有匹配项的行将删除。
                        U8中的会计数据主表由凭证表(gl_accvouch)、余额表(gl_accsum)、辅助余额表(gl_accass)这3张表构成。这3张审计中间表的审计数据转换操作,主要是代码转换,参照上图,实现这些表的科目代码、部门编码、职员编码、客户编码、供应商编码的转换,并建议科目代码实现科目名称全称的转换。
                        (四)金额格式转换(针对凭证,账簿的金额)
                        本部分的金额格式转换主要针对会计数据中凭证表的借贷方金额转换。
                        利用Excel实现凭证借贷金额格式的转换。数据源于“第四章/章节数据/ PZFILE金额转换操作.xlsx”。在此凭证表中,“JE”、“DC”列分别为 “金额”、“借贷方标志”列,其中“1”表示借方,“-1”表示贷方,将其转换为“借方发生额”与“贷方发生额”两个字段,操作如下:
                        添加“借方发生额”与“贷方发生额”两列,公式分别为“=IF(J2=1,I2,"")”、“=IF(J2=-1,I2,"")”,如图所示,实现金额格式的转换。

                        (五)长宽格式转换,利用.Power Query 的透视/逆透视。
                        长宽格式转换类似于Excel透视表的透视功能。在PowerQuery中就有【透视】和【逆透视】支持此类型的转换,远比Excel方便。


                        IP属地:山东21楼2022-06-06 17:56
                        回复
                          第五节 审计数据验证
                          本节简要介绍审计数据验证的内容、方法,运用会计数据进行验证操作。
                          一、审计数据验证内容
                          审计数据验证贯穿于审计采集、清理、转换的全过程,这些方法与审计采集后的验证方法与清理、转换的验证方法有重复之处,其目的都是提高审计数据质量,为后续审计数据分析做准备。对审计数据预处理过程进行验证可以考虑以下两个方面:
                          1.确认审计数据清理和转换目标实现。为了确认审计数据预处理的目标得以实现必须针对转换前存在的数据质量问题和转换要求逐一进行核对。为了确认数据清理和转换的目标得以实现,必须针对转换前存在的数据质量问题和转换要求逐一核对。例如,空值是否有效消除、冗余数据是否有效消除、错误数据是否有效消除、需要进行的结构变换是否有效完成等。检查在字段选择工作中,有无因操作失误,将确定需要保留的字段删除或仍然保留了需要删除的字段。对数据整合工作中的数据连接操作进行重点关注,检查有无因连接条件出现逻辑错误,或通过连接形成了不正确、改变原来经济含义的数据。
                          2.确认审计数据清理与转换工作没有损害数据的完整性和正确性。要确认审计数据预处理工作没有损害数据的完整性和正确性,就必须确认审计数据预处理过程中没有带来新的错误。
                          二、审计数据验证的方法(一)检查数据文件数量和大小
                          对半结构化、非结构化数据,将数据文件数量和大小与被审计单位提供的数据清单进行比对,核实是否遗漏。打开数据文件,核实数据是否可用、内容是否完整,检查数据与原始资料(如账务凭证、业务单据)是否一致。
                          (二)检查关系模型完整性约束
                          如果是基于数据库表的处理,可以检查数据库表的实体和主键约束,检查引用约束、检查用户定义的完整性约束等。
                          (三)核对数据总量和主要变量统计指标
                          可以核对总记录数、核对主要变量的统计指标等实现数据验证。
                          (四)验证业务规则
                          业务规则是一个系统正常处理业务活动所必须满足的一系列约束的集合,这些约束有来自系统外部的,如国家政策和法律法规;有来自系统内部的,如借贷记账法要求的借贷平衡,账务处理系统中各种账户之间的钩稽关系;有些约束还作为系统控制手段,如凭证号的连续性约束。利用这些约束可以对采集到的数据实施一定程度的验证。对于会计数据的验证,主要有检查借贷平衡、检查断号和重号、验证日期范围、验证勾稽关系等。
                          (五)统计抽样
                          当数据量巨大或者前面所述的方法无法使用时,可以考虑利用统计抽样方法。
                          三、会计数据验证操作 (一)会计凭证数量验证
                          PowerQuery的统计

                          (二)每月凭证借贷方平衡验证
                          (三)凭证断号验证


                          IP属地:山东22楼2022-06-06 17:56
                          回复


                            IP属地:山东25楼2022-06-06 18:12
                            回复