本文关键词: ttnn 2005年12期

数据质量与原始资料

我是做房产方面的数据分析。BI谈不上,目前只能算是报表吧。我目前所在的公司承接今年银川市房屋普查的数据处理工作,目前已经接近结项,数据处理经过了一个长长的路,有一些心得和尚存的疑惑。普查数据录入的前提是:严格遵守原表,录入错误不得超过万分之三。第一,因为以前没有做过此类的手工普查资料录入的事情,在试点数据录入设计时错误地估计了原始材料的质量,结果,录入过程中……

本文关键词: ttnn 2005年12期

数据质量实践初步

今天的话题要谈谈dqfw框架的应用,这已经考虑很久了。月初的时候,西宁兄就提出,如何将数据质量框架实际地应用到项目当中去,那个理论的框架,虽然定义了一系列指标和最后的质量报告,总觉得不具操作性。上周在和王璟吃饭时,大多谈论的就是这个话题,他们的项目已经被数据质量问题困扰。因此,在边吃边探讨的过程中,逐渐厘清了一点头绪。元数据——总结出……

本文关键词: ttnn 2005年12期

如何衡量数据管理的好坏

项目一期一期地建,可衡量标准仍然是模糊的。这是上次回北京,和王璟交流他们项目时的一点感触。他们金融行业的经营分析系统也是从一期走到二期,一期主要的目标,是做数据整合和单一客户视图。后者是一种应用,还是比较容易明确地度量,而前者是一种后者的支撑,相当于基础设施了。它可以用于单一客户视图,也可以用作其他诸如报表、贷款风险分析等应用的支撑。如何度量?不能度量,也就……

本文关键词: ttnn 2005年12期

坐井观BI 2005

2005年是BI领域惨淡经营的一年,最近几个朋友聊天的时候,言语中透出着不经意的无奈,“唉!你说,咋就没项目呢?”咋没项目?要说,其实还是有一些项目的,只不过不象前两年那样移动联通上经营分析的时候那般火爆而已,发感慨的朋友都是在电信圈里混饭吃的,而一般说到“电信圈”默认的含义是给几个运营商做项目的,难怪没项目呢……

本文关键词: ttnn 2005年12期

不同的“数据质量”含义

发现数据质量这个词从不同人的口中里出来,其实有着不同的含义。例如有的一提到数据质量,就说客户数据如何无意义,常常是地址、证件号码这类信息是否有效。而在这里谈论的数据质量问题,常指从数据从数据源,长途跋涉到最终报表、cube、分析应用的过程中,数据是否一致,转换的规则是否正确,因此需要一套质量体系来监控这个过程。这是客户需求决定的,因为在保证客户资料的有效性方……

本文关键词: ttnn 2005年12期

为说明元数据,再打个比方

前几天受到阿龙的批评——比喻说多了不好。比喻确实容易被滥用,也很容易误导人,让人忽视事物的本质。但比喻又确实是一种能够让人很快接受一个新概念的手段。对于元数据这个话题,上个月得出一个简单的"元数据内容模型"。提到"Data about Data"这个定义中两个Data的区别,还想再打个比方,希望……

本文关键词: ttnn 2005年12期

我也来作个比喻

模型设计 -> 大厦的设计图纸数据 -> 砖瓦、材料实施人员 -> 施工队ETL -> 建造大厦的过程BI TOOLS -> 装修Data Ming ->精装修DW -> 大厦业务人员 -> 业主客户IT部门 ->小区务业格式上有点乱..大家看时,仔细区分一下..另:经与刘庆的讨论,觉得...BI TOO……

本文关键词: ttnn 2005年12期

数据仓库应用

数据仓库能够支持报表和分析,以至于不少人认为数据仓库就是报表系统。由此也引发一个问题,数据仓库有了,在上面能进行什么应用的开发?我看可以分成如下几种类型:1. 固定报表。与通常理解的报表系统没有太大差别,只不过数据源来自数据仓库。比之前的报表系统有了较大进步,是因为原来的报表系统数据或者只来自一个系统,或干脆是经过人工填报而出,这样的系统数据来自真实的、唯一……

本文关键词: ttnn 2005年12期

一位销售经理的决策需求

BI系统不是仅仅高层领导用的,企业各个岗位的人员,都会有一些常规的事情需要判断,用基于数据的分析代替决策者大脑的经验判断,是比较合适的。去了解他们各自都有哪些事情需要做决定,并且是经常发生的决定,这就是BI起作用的地方。先从一位销售经理下手。一位制造业企业的省级销售经理,他的日常工作是管理销售代表,不多,也就八九个人,还有分布在各个地市的经销商。对于这样的角……

本文关键词: ttnn 2005年12期

我对分区的理解

随着ETL工作的深入,我对分区的理解逐渐发生着变化。在没有开始这个ETL项目之前,我一直认为分区是数据仓库优化的一项手段之一,并且在项目开始时,我也是和客户说在数据抽取到主题表后,也就是ETL过程结束后,配置数据展示的需求,也就是查询的需求,我再进行数据仓库的优化,包括分区、索引。客户也认为这样没什么不对的地方。ETL结束了,根据查询的要求,我给主题表进行了……

本文关键词: ttnn 2005年12期

探讨BI观点写作

看到这个问题,不禁有话要说。其实参与到这个论坛里面的兄弟姐妹们恐怕会在工作中遇到一些问题,譬如zsa提到的这个关于集市与仓库的问题,还有诸如"如果我们公司明年准备做BI项目,应该如何启动"之类的问题,甚至是细到一个技术问题,如"如何用Cognos做一个Cube"等。我有一个梦想,如果能够将这些问题都集中起来,岂不就是一……

本文关键词: ttnn 2005年11期

编后记

年初的时候,几个人凑到一起产生了一个想法——建个“BI blog通讯”,将BI业内人士的blog汇集到一起。可那时BI Blog并不多,因此这个想法只是停留在脑海中。逐渐地,这两个月在ttnn写文章的同仁增多了,经万阳提醒,“应该定期有个汇总吧”。这倒唤醒沉睡已久的想法,嗯,也许是时机到……

本文关键词: ttnn 2005年11期

元数据内容模型

再来说说元数据,从开始对元数据模糊的概念,渐渐地清晰了一些。原来总觉得"描述数据的数据"这个定义有些故弄玄虚,但似乎这么解释确实是比较精练的,只是这种表述让人不易理解。有必要将这两个数据区分开来。出现的第一个"数据",是指存在于企业IT环境中的有形的数据,是企业日积月累沉积下来的资产,就像日积月累沉积下来的客户资源一样……

本文关键词: ttnn 2005年11期

个人总结的SPSS Clementine Scripts基本语法

1.作者:bolow (cnjm)。转摘请标明出处2.本文大部分内容为笔者在业余时间根据SPSS的官方文档整理出来,* 按语法内容分成若干章节,大多数为语法元素的示意,讲解不多,* 阅读时可能要求您有其他语言的编程经验3.您在使用Clementine或者Clem Scripts时候遇到问题请不要给我发邮件,* 我现在正在为生计奔波,可能没有足够的时间帮您处理……

本文关键词: ttnn 2005年11期

xcelsius试用小记

昨天使用了一个软件——xcelsius,这是个看起来非常酷的玩意儿,花哨的界面,这个月刚给BO买下。它的主要功能就是将excel中的数据进行可视化,并且添加一些交互性。最终生成flash,嵌入到ppt或是pdf中,用于效果演示。其实这个可视化,在excel中有这些功能的,它的图表功能本身就是非常强大的。柱图、泡泡图、双轴线图等,丰富地……

(共 1491 条) 1 2... 91 92 93 94 95... 99 100
×
    信息化规划
    IT总包
    供应商选型
    IT监理
    开发维护外包
    评估维权
客服电话
400-698-9918