1. 描述
实际情况中,一个数据表中存有的数据是非常大的,比如说,合同信息表,一般性,表里面会存有近几年或者说所有年的合同信息,但是我们在使用数据表进行分析的时候大多时候只需要使用到本年或者近两年的数据,年代再远一点的基本上用不到,那么我们在将这种数据表添加到业务包中,如果将数据全部更新至cube中,数据量会非常大,导致cube会很笨重,FineBI提供了数据过滤功能,可以直接在原数据表的基础上进行ETL过滤转换,只更新指定时间或者指定条件的数据,有效的提升了数据加载效率,下面我们介绍如何使用ETL过滤转换数据表。
2. 操作步骤
我们以BIdemo业务包中的合同维度表,使之只更新合同状态为激活的数据,其他的无效数据就不用加载进来了。
根据前面的操作过程选择合同维度表,在ETL处理面板中,点击表名称,选择对该表-过滤选项,如下图:
2.1 过滤设置
点击对该表-过滤之后,页面跳转到过滤配置页面,如下图:
过滤配置可以通过添加公式或者添加条件来设置。
添加公式
添加公式是指使用该数据表字段作为参数,对其进行公式判断,比如说合同维度表中只想显示房间总价大于100W的数据(注意使用折扣字段,这才是真实交易价格),如下图:
注:只有公式合法,下方的确定按钮才可点击。
添加条件
添加条件是指直接使用数据表中的字段和字段值进行过滤,无需手动输入完整公式,直接选择给出的过滤条件类型并输入过滤条件数值,比如说合同维度表中只添加合同状态为激活的数据,点击添加条件,选择合同状态字段,如下图:
此时,过滤配
置界面会添加一个条件,选择过滤条件类型有属于,不属于,包含,不包含,为空,非空,开头是,结尾是,操作符使用默认属于->字段值,字段值选择激活,如下图:
注:值选择可多选,也可以将当前登录系统的用户名作为值传过去。
点击保存,这两个ETL-过滤操作就保存到数据表中,去cube更新后那么这张数据表的所有数据已经过滤为满足我们设置条件的数据了。
2.2 数据表过滤与前端分析过滤的需求
同之前使用部分字段功能中讲解的一样,数据表过滤是基于原始数据库中的数据直接进行过滤,从而让无用数据不需抽取到CUBE中处理,减小了CUBE体积并提高更新效率。而前端过滤则是对已经在cube中处理过的数据进行过滤和展示。综上,两个功能存在先后顺序,且数据表过滤的作用和功能更大。
因篇幅问题不能全部显示,请点此查看更多更全内容