最新消息: USBMI致力于为网友们分享Windows、安卓、IOS等主流手机系统相关的资讯以及评测、同时提供相关教程、应用、软件下载等服务。

计算机知识复习

IT圈 admin 0浏览 0评论

计算机知识复习

各位转载请注明出处。

.html 



计算机网络

物理层

比特

 

数据链路层

point to point ,hop to hop

网络层

分组

host to host

传输层

数据段

end to end

数据链路层

意图

为网络层提供可靠的物理链路。

成帧(帧分割),错误控制(校验位),流(速度)控制。

硬件

网桥

连接LAN

VLAN

减小广播域

交换机

连接host,减小冲突域

路由器

路由,网络层

单工、双工、半双工

停等协议

问题:接收方不可能无限快速处理接收的数据,考虑接收方缓存大小

解决方案:接受方提供反馈信息

滑动窗口协议

回退1,回退n的滑动窗口协议

选择性重传协议,超时限制2T+dt

介质访问子层,载波监听多路响应协议

监听,随机延时,非持续,p持续(1-p)再延时

透明网桥,生成树网桥

网络层

私用IP

10.x.x.x

172.16-31.x.x

198.168.x.x

TTL

ip协议通过TTL,经过一个路由减一,至0丢弃,防止分组在网上泛滥。

VLSM变长子网掩码

CIDR无类间路由选择,路由汇总

NAT

建立内部,外部或私用地址 --> 全局地址的映射。

ARP协议

获取缓存【IP,MAC】映射

广播查询自己要用的ip地址,无响应,使用之

ICMP协议

网络不可达,主机不可达,端口不可达

DHCP协议

广播DHCP DISCOVER分组

DHCP服务器

地址池

租用,续租

RIP协议——路由信息协议

每30秒转发路由表

计数到无穷,慢收敛问题

OSPF协议——开放最短路径协议

RIP是告诉别人最短地址

OSPF是在网络结构结构变化时,自己计算最短路径,保存AS自治区域的网络结构

BGP协议——外部网关协议

边界路由器转发AS自治区域间的信息。

传输层

TCP有限状态机

TCP建立——三次握手,非对称

TCP释放——四次握手,对称

TCP传输策略——滑动窗口协议,接收方反馈窗口更新数据段

死锁问题:确认信息丢失了,导致死锁问题。

Nagle算法:一个字节只发送第一个,其余的缓冲直到之前送的数据被确认。

(解决笨窗口综合症silly window syndrome)

Clark算法:接受方禁止发送一个字节的窗口更新数据段

TCP拥塞控制

所有的Internet TCP算法都假定超时是由于拥塞引起的。

慢启动算法:在接收方允许窗口外,增加一个拥塞窗口。到达阀值前,指数增长,到达阀值后,线性增长,当一次超时发生的时候,阀值被设置为当前拥塞窗口的一半。超时的时候,阀值->cWin/2,cWin->1 MSS。

UDP协议

源端口

目标端口

长度

检验和

DNS使用了UDP

Socket TIME_WAIT状态

1.        可靠的实现TCP全双工连接的终止

2.        允许老的重复数据段在网络中消逝,而不被下一个监视相同端口的进程获取

Socket网络服务器介绍

并发服务器

进程池

竞争accept

阻塞/非阻塞

API TCP

作用

socket

创建socket

connect

连接服务器

send

发送数据

recv

接收数据

bind

绑定监听端口,一般用于服务器

listen

监听端口,用于服务器

accept

服务器接收客户端连接

select

检查可用文件描述符集合

API UDP

作用

sendto

发送UDP包

recvfrom

接收UDP包

close

关闭socket

并发服务器介绍

迭代服务器

只有一个进程/线程处理请求,select + 非阻塞recv 多路复用

迭代/并发混合型服务器

平时迭代处理。对耗时多的请求,创建一个进程/线程,把处理转给新的进程/线程处理,主进程/线程继续处理其他请求。

并发服务器——Prefork模型

1.        每个连接fork一个进程

  1. 子进程Accept,惊群现象

3.        主进程accept,通过流管道转发fd到子进程

线程进程比较

线程性能比使用进程要高,但代码比较复杂,对代码质量要求更高。

线程出错后可能会影响到所有线程,多进程的模式一个进程出错一般不会影响其他进程。

多线程模型共享数据比较简单有效,多进程模型共享数据比较麻烦,效率也不如线程。

线程间同步

WINDOWS内核提供的可以用来进行线程同步的内核对象,都是可以发信号(Signaled)的对象,在WINDOWS中它们被称为“调度程序对象”(dispatcher object)。它们包括进程(PROCESS)、线程(THREAD)、事件(EVENT)、信号量(SEMAPHORE)、互斥(MUTEX)、时钟(TIMER)等。

操作系统——编程接口

进程状态

五状态模型

用户模式与内核模式的区别

内核模式保护操作系统和重要的操作系统数据表(例如控制块)不受用户程序的干扰。

在程序状态字中标记,当用户执行系统调用时,执行模式才切换成内核模式。

模式切换(用户,内核)与状态切换(执行,挂起)的区别

线程

用户级线程和内核级线程

用户线程:使用线程库完成,线程阻塞导致进程阻塞,过去的线程库不擅于使用多核。不需要模式切换,调度算法由线程库制定,不需要内核支持。

内核线程:内核提供API,可利用多核,但是会进行模式切换。

微内核

只有最基本的操作系统功能才能放在内核中,非基本的服务都在微内核上构造,并在用户模式下执行。

进程调度

调度类型

1.        长程调度:进程创建,就绪状态的进入。

2.        中程调度:就绪,挂起,阻塞的状态的进入。

3.        短程调度:从就绪状态进入运行状态。

调度算法

1.        FCFS:先来先服务

2.        轮转:时间片分配

3.        最短进程优先

4.        最短剩余时间优先

5.        最高响应比

6.        反馈

并发性:互斥与同步

信号量

P操作:信号量减一,变负则阻塞。

V操作:信号量加一,小于等于0,唤醒进程。

互斥mutex

生产者消费者问题,可以用信号量解决

读者写者问题

读锁,写锁

与生产者消费者的区别在于:读进程可以同时若干个,写进程同时只有一个。

并发性:死锁与饥饿

(饥饿)活锁

因为调度策略的问题,某个进程可能一直等待下去,饥饿。

死锁产生条件

1.        互斥

2.        占有并等待

3.        非抢占

4.        循环等待

死锁预防

1.        互斥

2.        占有并等待:一次性请求所有资源。

3.        非抢占:进一步请求资源被拒,释放所有资源。

4.        循环等待:一个进程已经分配到R,只能请求编号在R之后的资源。

死锁避免

1.        进程启动拒绝

2.        资源分配拒绝

死锁检测

标记法。

内存

缓冲设计

1.        单缓冲

2.        双缓冲

3.        循环缓冲

分页

主存被分成大小固定相等的,每个进程也被分成块,称为“页”。可能产生内部碎片,很难被共享。

分段

按照程序模块,动态分段。会产生外部碎片。

虚存替换策略

最佳OPT

最近最少使用LRU

先进先出FIFO

时钟CLOCK

面向对象设计

设计模式

设计模式概念

总体来说,设计模式是前人OO设计时,大量经验的文档化总结。

设计模式抽象出成功或失败设计的共性,并进行分类与标识。

设计模式通过描述对象、协作和责任将设计中的意图抽取出来。

模式的三大要素

背景(Context那些适合运用该模式的可重现情形。

问题(Problem出现在背景中的一系列影响力,即目标与约束。

解决方案(Solution可用于解决问题的经典设计形式或设计规则。

设计原则

设计原则概念

设计原则是面向对象设计的指导思想。

抽象

适应变化

基于接口来编程

关注点和责任的分离

对象持久性设计

类设计原则

Single Responsibility Principle:责任单一,关注点单一,改变类的理由单一

Open Closed Principle:在不修改源代码的情况下拓展

Liskov Substitution Principle:派生类应该可置换其基类

Dependency Inversion Principle:依赖关系建立在接口或抽象的类的基础上

Interface Segregation Principle:每一类责任创建特定的接口,让这个类多继承这些接口

应用框架

应用框架概念

应用框架是可复用的半完整基础设施。

SOA(比较核心:ESB企业服务总线,治理governing

可扩展标注语言XML eXtensible Markup Language

z 由W3C发布XML规范。

z 在Web服务的体系结构中扮演了通信基础的角色。

xml分类

1.        以XML Parser如何回应(feedback)调用者的方式分成两大类:

a)       事件驱动类(event-driven)。代表是SAX(Simple API for XML)

b)       对象模型类(object model)。代表是DOM(Document Object Model)。

2.        XPath:用于拿到XML中的数据。

3.        XQuery:相当与XML的SQL。

 

XML采用严格的标记表达信息的数据结构,并具有良好的可扩展性。

z 优点:适合在一个分布式环境中交换数据,已成为电子商务应用中信息交换的事实标准。

z 不足:性能开销较大。

z 例如:由OASIS和UN/CEFACT联合制订的ebXML规范为企业间交换业务消息、建立商贸联系、定义和注册业务过程等定义了标准方法,支持不同企业业务过程集成。

简单对象访问协议SOAPSimple Object Access Protocol

z 由W3C发布SOAP规范。

z 是Web服务采用的标准通信协议。

Web服务的通信

z Web服务利用SOAP协议实现在标准HTTP协议上独立编程语言的远程过程调用(RPC)。

z 功能调用的参数与返回结果均被打包为SOAP格式并正确地传送给服务请求方与提供方。

Web服务描述语言 WSDLWeb Services Definition Language

z 由W3C发布WSDL规范。

z 为Web服务提供了一种基于XML的描述语言。

WSDL本质上可看作一种基于XMLIDL语言

z 可用于描述一个Web服务支持的功能调用操作,包括这些操作的参数与返回结果。

z 与OMG IDL类似,WSDL也无法表达一个Web服务的

语义,需要一个可读的文档帮助程序员理解Web服务接

口中定义的操作。

通用描述,发现与集成UDDIUniversal Description, Discovery and Integration

z 由OASIS发布UDDI规范。

z 用于Web服务的发布与检索。

– Web服务提供一种全球性的目录服务

z 定义了UDDI目录中发布和发现Web服务的标准协议。

z 尽管支持向匿名业务伙伴发布Web服务,实际上大多数服务供应商都希望控制服务的使用方式和使用范围。

z 还支持服务消费者动态发现Web服务,但在B2B电子商务中不大实用,因为在使用Web服务前业务伙伴通常会就业务安排、QoS等进行协商,并对Web服务进行严格的测试。

软件工程

软件体系结构(Software Architecture Software Architecture

1.        关注软件系统由什么构件组成,以及这些构件之间的关系。

2.        典型的软件体系结构风格:

3.        层次:操作系统、通信协议、企业应用、…

4.        管道/过滤器:编译器、信号处理程序、…

5.        事件驱动:图形用户界面(GUI)、实时控制、…

6.        多种软件体系结构风格的组合运用

企业应用的3层(3-tier)结构

数据挖掘

数据挖掘功能

1.        概念描述:特征化和区分

2.        关联分析:相关性和因果关系

3.        分类和预测

4.        聚类分析:把数据聚类或分组成新的类

5.        孤立点分析

6.        演变分析

 

智能推荐算法

Association Rules: Apriori

Slope one

SVD

做完以后再用KNN做文本分类。

数据库原理

数据库范式

1.        第一范式(1NF):数据库表中的字段都是单一属性的,不可再分。

2.        第二范式(2NF):数据库表中不存在非关键字段对候选关键字段的部分函数依赖。

3.        第三范式(3NF):数据表中如果不存在非关键字段对候选关键字段的传递函数依赖。

数据库设计基本过程

1.        需求分析(->需求说明书)

2.        概念设计(需求说明书->ER图)

3.        逻辑设计(ER图->DBMS对应逻辑结构,例如:表)

4.        物理设计(->部署,存取方法,集簇,索引,分区等设计)

ACID事务特性

事务的四大要素 ── ACID

1.        AAtomicity:不可分割的工作单元。

a)       要么全部做完,要么什么都别做。

2.        CConsistency:保持系统状态稳定(即维持系统状态不变式)。

a)       如果无法维持,则事务将被取消。

3.        IIsolation:不受并发执行的其他事务影响。

a)       需要一种加锁策略。

4.        DDurability:事务提交后的效果是永久的。

a)       意味着持久存储,例如使用数据库。

对象关系映射OR mappingby leeman

对象标识OID

1.        惟一性,注意唯一性的范围

2.        不变性,注意对象标识不应含有任何业务逻辑含义!产品编码不应该作为OID,因为产品编码有可能会改变。

OR映射基本策略

① 将属性映射为列。

② 将类映射为表。

③ 类间关系(继承、聚集、关联)的映射。

具体做法

3.        将属性映射为列。注意,transient属性不保存,引用属性保存为OID。

a)       标识持久对象:带标签的值(Tagged Value)

b)       多个类映射到单张表。注意:对象范式含有数据与操作,关系范式仅有数据;故O/R映射丢失操作后,某些数据可能更适合合并。

c)        单个类映射到多张表:因为效率原因才会将一个类映射到多张表。两种划分方式:水平划分:将不经常访问的实例存放到另外一张表中。垂直划分:将不经常访问的属性存放到另外一张表中。

4.        继承关系的映射。

d)       整个类层次使用一张,类层次中所有类的所有属性均存放在该表中。

e)       每个叶结点使用一张表,该表保存了该类自己的以及所继承的所有属性。

f)        每个类使用一张表,该表只保存OID以及对应类自己的属性(不含所继承的属性)。

5.        关联与聚集关系的映射。

g)       一对一,一对多:外键即可。

h)       多对多:引入一个新的表,专门记录这种多对多关系。

 

Web开发

  1. HTTP——应用层网络协议,无状态,单向

2.        HTML——数据

3.        DOM——数据结构,接口

4.        CSS——表现

5.        JavaScript——控制语言

6.        JQuery——对JavaScript的封装,丰富的插件

7.        ActionScript3.0——flash的脚本语言

软件测试——分类学

分类学

它们的“交”为空集,它们的“并”为全集。

通常测试用力分类

1.        正常输入

2.        异常输入

3.        输入分类

4.        边界值测试

1

 


转载于:.html

计算机知识复习

各位转载请注明出处。

.html 



计算机网络

物理层

比特

 

数据链路层

point to point ,hop to hop

网络层

分组

host to host

传输层

数据段

end to end

数据链路层

意图

为网络层提供可靠的物理链路。

成帧(帧分割),错误控制(校验位),流(速度)控制。

硬件

网桥

连接LAN

VLAN

减小广播域

交换机

连接host,减小冲突域

路由器

路由,网络层

单工、双工、半双工

停等协议

问题:接收方不可能无限快速处理接收的数据,考虑接收方缓存大小

解决方案:接受方提供反馈信息

滑动窗口协议

回退1,回退n的滑动窗口协议

选择性重传协议,超时限制2T+dt

介质访问子层,载波监听多路响应协议

监听,随机延时,非持续,p持续(1-p)再延时

透明网桥,生成树网桥

网络层

私用IP

10.x.x.x

172.16-31.x.x

198.168.x.x

TTL

ip协议通过TTL,经过一个路由减一,至0丢弃,防止分组在网上泛滥。

VLSM变长子网掩码

CIDR无类间路由选择,路由汇总

NAT

建立内部,外部或私用地址 --> 全局地址的映射。

ARP协议

获取缓存【IP,MAC】映射

广播查询自己要用的ip地址,无响应,使用之

ICMP协议

网络不可达,主机不可达,端口不可达

DHCP协议

广播DHCP DISCOVER分组

DHCP服务器

地址池

租用,续租

RIP协议——路由信息协议

每30秒转发路由表

计数到无穷,慢收敛问题

OSPF协议——开放最短路径协议

RIP是告诉别人最短地址

OSPF是在网络结构结构变化时,自己计算最短路径,保存AS自治区域的网络结构

BGP协议——外部网关协议

边界路由器转发AS自治区域间的信息。

传输层

TCP有限状态机

TCP建立——三次握手,非对称

TCP释放——四次握手,对称

TCP传输策略——滑动窗口协议,接收方反馈窗口更新数据段

死锁问题:确认信息丢失了,导致死锁问题。

Nagle算法:一个字节只发送第一个,其余的缓冲直到之前送的数据被确认。

(解决笨窗口综合症silly window syndrome)

Clark算法:接受方禁止发送一个字节的窗口更新数据段

TCP拥塞控制

所有的Internet TCP算法都假定超时是由于拥塞引起的。

慢启动算法:在接收方允许窗口外,增加一个拥塞窗口。到达阀值前,指数增长,到达阀值后,线性增长,当一次超时发生的时候,阀值被设置为当前拥塞窗口的一半。超时的时候,阀值->cWin/2,cWin->1 MSS。

UDP协议

源端口

目标端口

长度

检验和

DNS使用了UDP

Socket TIME_WAIT状态

1.        可靠的实现TCP全双工连接的终止

2.        允许老的重复数据段在网络中消逝,而不被下一个监视相同端口的进程获取

Socket网络服务器介绍

并发服务器

进程池

竞争accept

阻塞/非阻塞

API TCP

作用

socket

创建socket

connect

连接服务器

send

发送数据

recv

接收数据

bind

绑定监听端口,一般用于服务器

listen

监听端口,用于服务器

accept

服务器接收客户端连接

select

检查可用文件描述符集合

API UDP

作用

sendto

发送UDP包

recvfrom

接收UDP包

close

关闭socket

并发服务器介绍

迭代服务器

只有一个进程/线程处理请求,select + 非阻塞recv 多路复用

迭代/并发混合型服务器

平时迭代处理。对耗时多的请求,创建一个进程/线程,把处理转给新的进程/线程处理,主进程/线程继续处理其他请求。

并发服务器——Prefork模型

1.        每个连接fork一个进程

  1. 子进程Accept,惊群现象

3.        主进程accept,通过流管道转发fd到子进程

线程进程比较

线程性能比使用进程要高,但代码比较复杂,对代码质量要求更高。

线程出错后可能会影响到所有线程,多进程的模式一个进程出错一般不会影响其他进程。

多线程模型共享数据比较简单有效,多进程模型共享数据比较麻烦,效率也不如线程。

线程间同步

WINDOWS内核提供的可以用来进行线程同步的内核对象,都是可以发信号(Signaled)的对象,在WINDOWS中它们被称为“调度程序对象”(dispatcher object)。它们包括进程(PROCESS)、线程(THREAD)、事件(EVENT)、信号量(SEMAPHORE)、互斥(MUTEX)、时钟(TIMER)等。

操作系统——编程接口

进程状态

五状态模型

用户模式与内核模式的区别

内核模式保护操作系统和重要的操作系统数据表(例如控制块)不受用户程序的干扰。

在程序状态字中标记,当用户执行系统调用时,执行模式才切换成内核模式。

模式切换(用户,内核)与状态切换(执行,挂起)的区别

线程

用户级线程和内核级线程

用户线程:使用线程库完成,线程阻塞导致进程阻塞,过去的线程库不擅于使用多核。不需要模式切换,调度算法由线程库制定,不需要内核支持。

内核线程:内核提供API,可利用多核,但是会进行模式切换。

微内核

只有最基本的操作系统功能才能放在内核中,非基本的服务都在微内核上构造,并在用户模式下执行。

进程调度

调度类型

1.        长程调度:进程创建,就绪状态的进入。

2.        中程调度:就绪,挂起,阻塞的状态的进入。

3.        短程调度:从就绪状态进入运行状态。

调度算法

1.        FCFS:先来先服务

2.        轮转:时间片分配

3.        最短进程优先

4.        最短剩余时间优先

5.        最高响应比

6.        反馈

并发性:互斥与同步

信号量

P操作:信号量减一,变负则阻塞。

V操作:信号量加一,小于等于0,唤醒进程。

互斥mutex

生产者消费者问题,可以用信号量解决

读者写者问题

读锁,写锁

与生产者消费者的区别在于:读进程可以同时若干个,写进程同时只有一个。

并发性:死锁与饥饿

(饥饿)活锁

因为调度策略的问题,某个进程可能一直等待下去,饥饿。

死锁产生条件

1.        互斥

2.        占有并等待

3.        非抢占

4.        循环等待

死锁预防

1.        互斥

2.        占有并等待:一次性请求所有资源。

3.        非抢占:进一步请求资源被拒,释放所有资源。

4.        循环等待:一个进程已经分配到R,只能请求编号在R之后的资源。

死锁避免

1.        进程启动拒绝

2.        资源分配拒绝

死锁检测

标记法。

内存

缓冲设计

1.        单缓冲

2.        双缓冲

3.        循环缓冲

分页

主存被分成大小固定相等的,每个进程也被分成块,称为“页”。可能产生内部碎片,很难被共享。

分段

按照程序模块,动态分段。会产生外部碎片。

虚存替换策略

最佳OPT

最近最少使用LRU

先进先出FIFO

时钟CLOCK

面向对象设计

设计模式

设计模式概念

总体来说,设计模式是前人OO设计时,大量经验的文档化总结。

设计模式抽象出成功或失败设计的共性,并进行分类与标识。

设计模式通过描述对象、协作和责任将设计中的意图抽取出来。

模式的三大要素

背景(Context那些适合运用该模式的可重现情形。

问题(Problem出现在背景中的一系列影响力,即目标与约束。

解决方案(Solution可用于解决问题的经典设计形式或设计规则。

设计原则

设计原则概念

设计原则是面向对象设计的指导思想。

抽象

适应变化

基于接口来编程

关注点和责任的分离

对象持久性设计

类设计原则

Single Responsibility Principle:责任单一,关注点单一,改变类的理由单一

Open Closed Principle:在不修改源代码的情况下拓展

Liskov Substitution Principle:派生类应该可置换其基类

Dependency Inversion Principle:依赖关系建立在接口或抽象的类的基础上

Interface Segregation Principle:每一类责任创建特定的接口,让这个类多继承这些接口

应用框架

应用框架概念

应用框架是可复用的半完整基础设施。

SOA(比较核心:ESB企业服务总线,治理governing

可扩展标注语言XML eXtensible Markup Language

z 由W3C发布XML规范。

z 在Web服务的体系结构中扮演了通信基础的角色。

xml分类

1.        以XML Parser如何回应(feedback)调用者的方式分成两大类:

a)       事件驱动类(event-driven)。代表是SAX(Simple API for XML)

b)       对象模型类(object model)。代表是DOM(Document Object Model)。

2.        XPath:用于拿到XML中的数据。

3.        XQuery:相当与XML的SQL。

 

XML采用严格的标记表达信息的数据结构,并具有良好的可扩展性。

z 优点:适合在一个分布式环境中交换数据,已成为电子商务应用中信息交换的事实标准。

z 不足:性能开销较大。

z 例如:由OASIS和UN/CEFACT联合制订的ebXML规范为企业间交换业务消息、建立商贸联系、定义和注册业务过程等定义了标准方法,支持不同企业业务过程集成。

简单对象访问协议SOAPSimple Object Access Protocol

z 由W3C发布SOAP规范。

z 是Web服务采用的标准通信协议。

Web服务的通信

z Web服务利用SOAP协议实现在标准HTTP协议上独立编程语言的远程过程调用(RPC)。

z 功能调用的参数与返回结果均被打包为SOAP格式并正确地传送给服务请求方与提供方。

Web服务描述语言 WSDLWeb Services Definition Language

z 由W3C发布WSDL规范。

z 为Web服务提供了一种基于XML的描述语言。

WSDL本质上可看作一种基于XMLIDL语言

z 可用于描述一个Web服务支持的功能调用操作,包括这些操作的参数与返回结果。

z 与OMG IDL类似,WSDL也无法表达一个Web服务的

语义,需要一个可读的文档帮助程序员理解Web服务接

口中定义的操作。

通用描述,发现与集成UDDIUniversal Description, Discovery and Integration

z 由OASIS发布UDDI规范。

z 用于Web服务的发布与检索。

– Web服务提供一种全球性的目录服务

z 定义了UDDI目录中发布和发现Web服务的标准协议。

z 尽管支持向匿名业务伙伴发布Web服务,实际上大多数服务供应商都希望控制服务的使用方式和使用范围。

z 还支持服务消费者动态发现Web服务,但在B2B电子商务中不大实用,因为在使用Web服务前业务伙伴通常会就业务安排、QoS等进行协商,并对Web服务进行严格的测试。

软件工程

软件体系结构(Software Architecture Software Architecture

1.        关注软件系统由什么构件组成,以及这些构件之间的关系。

2.        典型的软件体系结构风格:

3.        层次:操作系统、通信协议、企业应用、…

4.        管道/过滤器:编译器、信号处理程序、…

5.        事件驱动:图形用户界面(GUI)、实时控制、…

6.        多种软件体系结构风格的组合运用

企业应用的3层(3-tier)结构

数据挖掘

数据挖掘功能

1.        概念描述:特征化和区分

2.        关联分析:相关性和因果关系

3.        分类和预测

4.        聚类分析:把数据聚类或分组成新的类

5.        孤立点分析

6.        演变分析

 

智能推荐算法

Association Rules: Apriori

Slope one

SVD

做完以后再用KNN做文本分类。

数据库原理

数据库范式

1.        第一范式(1NF):数据库表中的字段都是单一属性的,不可再分。

2.        第二范式(2NF):数据库表中不存在非关键字段对候选关键字段的部分函数依赖。

3.        第三范式(3NF):数据表中如果不存在非关键字段对候选关键字段的传递函数依赖。

数据库设计基本过程

1.        需求分析(->需求说明书)

2.        概念设计(需求说明书->ER图)

3.        逻辑设计(ER图->DBMS对应逻辑结构,例如:表)

4.        物理设计(->部署,存取方法,集簇,索引,分区等设计)

ACID事务特性

事务的四大要素 ── ACID

1.        AAtomicity:不可分割的工作单元。

a)       要么全部做完,要么什么都别做。

2.        CConsistency:保持系统状态稳定(即维持系统状态不变式)。

a)       如果无法维持,则事务将被取消。

3.        IIsolation:不受并发执行的其他事务影响。

a)       需要一种加锁策略。

4.        DDurability:事务提交后的效果是永久的。

a)       意味着持久存储,例如使用数据库。

对象关系映射OR mappingby leeman

对象标识OID

1.        惟一性,注意唯一性的范围

2.        不变性,注意对象标识不应含有任何业务逻辑含义!产品编码不应该作为OID,因为产品编码有可能会改变。

OR映射基本策略

① 将属性映射为列。

② 将类映射为表。

③ 类间关系(继承、聚集、关联)的映射。

具体做法

3.        将属性映射为列。注意,transient属性不保存,引用属性保存为OID。

a)       标识持久对象:带标签的值(Tagged Value)

b)       多个类映射到单张表。注意:对象范式含有数据与操作,关系范式仅有数据;故O/R映射丢失操作后,某些数据可能更适合合并。

c)        单个类映射到多张表:因为效率原因才会将一个类映射到多张表。两种划分方式:水平划分:将不经常访问的实例存放到另外一张表中。垂直划分:将不经常访问的属性存放到另外一张表中。

4.        继承关系的映射。

d)       整个类层次使用一张,类层次中所有类的所有属性均存放在该表中。

e)       每个叶结点使用一张表,该表保存了该类自己的以及所继承的所有属性。

f)        每个类使用一张表,该表只保存OID以及对应类自己的属性(不含所继承的属性)。

5.        关联与聚集关系的映射。

g)       一对一,一对多:外键即可。

h)       多对多:引入一个新的表,专门记录这种多对多关系。

 

Web开发

  1. HTTP——应用层网络协议,无状态,单向

2.        HTML——数据

3.        DOM——数据结构,接口

4.        CSS——表现

5.        JavaScript——控制语言

6.        JQuery——对JavaScript的封装,丰富的插件

7.        ActionScript3.0——flash的脚本语言

软件测试——分类学

分类学

它们的“交”为空集,它们的“并”为全集。

通常测试用力分类

1.        正常输入

2.        异常输入

3.        输入分类

4.        边界值测试

1

 


转载于:.html

与本文相关的文章

发布评论

评论列表 (0)

  1. 暂无评论