数据仓库数据挖掘期末复习题(2024-2025第1学期大数据版) 1 数据分析的基本步骤有哪些?每个步骤的主要工作2 关于大数据的4V理论是什么?3 四种基本度量尺度适用的集中趋势和离散度量方法有哪些?4 数据对象的相似性有哪些方法5 数据属性的相关性有哪些方法(斯皮尔曼等级相关系数,皮尔森)6 数据预处理的主要任务有哪些?每个任务要解决的问题主要有哪些?7 脏数据主要有哪几种?产生的主要原因是什么?8缺失值的处理方法有哪些?9 什么是噪音数据?产生的原因有哪些 2025-03-03 数据仓库数据挖掘 #数据仓库数据挖掘
人工智能导论考试预测 演绎推理※23 一般到个别 归纳推理 个别到一般 完全归纳推理和不完全归纳推理 默认推理 缺省推理,假设某些知识已经具备 确定性推理 知识证据确定,结论也确定 不确定性推理※22 推理时所用的知识与证据不都是确定的,推出的结论也是不确定的。 单调推理 随推理深入,越来越接近目标 非单调推理 由于新知识加入,反而要否定已有结论,使推理返回到某一步重新开始 启发式推理 启发性知识:与问题 2025-01-07 人工智能导论 #人工智能导论
计算机网络复习 计算机网络第一章 引入计算机网络的概念 以资源共享为目的的自治系统的集合 点对点网络P2P(peer-to-peer) 每台设备既可以是服务器,也可以是客户机,关系对等(平等) 用户之间是Connected,主要用软件支持,如资源的定位,数据传递路径的确定等。每个节点需要有路由功能。 计算机网络技术设计最基本的要求 数据送达、资源使用高效 计算机网络按传输技术分类Transmission T 2025-01-04 计算机网络 #计算机网络
人工智能导论复习 第四章 不确定性推理方法可信度方法推理 从已知事实(证据)出发,通过运用相关知识逐步推出结论或者证明某个假设成立或不成立的思维过程。 不确定性推理 从不确定性的初始证据出发,通过运用不确定性的知识,最终推出具有一定程度的不确定性但却是合理或者近乎合理的结论的思维过程。 可信度 根据经验对一个事物或现象为真的相信程度。 C-F模型 基于可信度表示的不确定性推理的基本方法。 知识的不确定性表示 2025-01-01 人工智能导论 #人工智能导论
NoSQL复习 第一章 NoSQL数据库概述关系数据库的不足 大量数据的写入处理 表结构变更及建立索引 字段不固定的应用 对简单查询需要快速返回结果的处理 NoSQL数据库的优势 易于数据的分散 提升性能和增大规模 模式灵活 扩展性好 NoSQL数据库的种类 存储类型 代表解决方案 特点 列存储 Hbase, Cassandra, Hypertable 按列存储,适用于数据压缩,对一个或几个字段进行 2024-12-30 Nosql #Nosql