2.1 前期调研
在建设数据仓库之前,要先对企业的业务和需求进行充分调研,这是搭建数据仓库的基石。业务调研与需求分析是否充分直接决定了数据仓库的搭建能否成功,这对后期数据仓库总体架构的设计、数据主题的划分有重大影响。前期调研主要从以下几个方面展开。
1.业务调研
企业的实际业务涵盖很多业务领域,不同的业务领域包含多条业务线。数据仓库的搭建是涵盖企业的所有业务领域,还是单独建设每个业务领域,是开发人员需要重点考虑的问题,在业务线方面也面临同样的问题。在搭建数据仓库之前,要先对企业的业务进行深入调研,了解企业的各业务领域包含哪些业务线、业务线之间存在哪些相同点和不同点,以及业务线是否可以划分为不同的业务模块等。在搭建数据仓库时,要对以上问题进行充分考量,本项目的业务线主要以金融租赁审批流程为主线,围绕金融租赁审批流程的相关维度和事实构建数据仓库,为金融租赁行业的数据分析和企业决策提供全方位支持。
2.需求调研
对业务系统有充分的了解并不意味着就可以实施数据仓库建设,操作者还需要充分收集数据分析人员、业务运营人员的数据诉求和报表需求。需求调研通常从两个方面展开,一方面是通过与数据分析人员、业务运营人员和产品人员进行沟通来获取需求;另一方面是通过对现有报表和数据进行分析,从而获取需求。
例如,业务运营人员想了解截至当日处于不同审批状态的项目分别有多少个,针对该需求,我们来分析需要使用哪些维度数据和度量数据,以及明细宽表应该如何设计。
3.数据调研
数据调研是指在搭建数据仓库之前的数据探查工作。开发人员需要充分了解数据库类型、数据来源、每日的数据产生体量、数据库全量数据大小、数据库中表的详细分类,以及所有数据类型的数据格式。通过了解数据格式,可以确定数据是否需要清洗、是否需要做字段一致性规划,以及如何从原始数据中提炼有效信息等。
例如,本项目的数据来源主要是业务数据,因此需要重点分析业务流程,了解每个业务数据表中的数据结构和字段含义。