扫二维码与项目经理沟通
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流
总结平常工作中几种校验数据的思路
在江汉等地区,都构建了全面的区域性战略布局,加强发展的系统性、市场前瞻性、产品创新能力,以专注、极致的服务理念,为客户提供网站设计制作、做网站 网站设计制作按需网站设计,公司网站建设,企业网站建设,品牌网站制作,网络营销推广,成都外贸网站建设公司,江汉网站建设费用合理。1、对比其他渠道数据结果
查询需求:从Hive端查询20190909当天的订单量(简单例子),需要校验SQL结果是否正确
校验方法:Hive的上游数据源为Mysql,Mysql端会有一些产出数据可供校验
如上数据流程下,如果在展现订单数据量的情况下,Hive执行查询结果需要验证,可以从Mysql渠道的数据结果进行对比来校验。
举的例子比较简单,但是属于校验数据结果的一个思路和方法。
2、分量累加比较总量
表结构:
订单ID 订单日期 订单渠道
1 20190808 A
2 20190808 A
3 20190808 B
4 20190808 B
5 20190807 C
5 20190807 C
5 20190807 C
5 20190807 C
5 20190807 C
查询需求:查询每天,每个渠道的订单量
校验方法:可对每天,每个渠道的订单量进行累加,看看是否与当天总订单量相同
3、分步验证结果(A left join B left join C的情况)
有订单表,商品表,用户表
查询需求:查询电子产品,用户年龄小于18岁的订单明细
校验方法:遇到这类查询场景,首先用订单表 Join 商品表,确定符合电子产品的订单明细以及数据量,这归结为第一步校验;
在第一步校验基础上再关联用户表,筛选用户年龄小于18岁的条件,进行第二部校验。
另外有需要云服务器可以了解下创新互联scvps.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流