香港腕表价格交流群

【第十九届IT文化节】你有一份数据分析干货礼包——数据分析大赛(拉到最下面有惊喜大礼!)

2020-11-08 11:18:55

数据分析大赛

强势来袭



此赛前准备之际我们为大家准备了干货满满的数据分析常用算法、软件介绍!如果你是初入茅庐的新手,那么你将获得关于数据分析的知识总览;如果你已深谙此道,那么它将引你重新回顾重点知识并激发你比赛的灵光!


话不多说,让我们进入正题。


数据挖掘(Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(KDD)中的一个步骤。数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息的过程。


01

学习数据挖掘步骤

挖掘案例背景 → 数据简述 → 数据初表查看和加工 → 数据终表和权重优化 → 分类任务中的数据平衡 → 平衡数据后的提升图 → 挖掘算法功力比较


数据挖掘术语简介

02

数据集:是一个数据的集合,通常以表格形式出现。每一列代表一个特定变量。每一行都对应于某一成员的数据集的问题。

变量:数据集中的每一列都是在描述不同成员的同类信息。

观察项:每一行代表了一个观察项,描述一个特定成员不同维度的信息。

维度:在一定前提下描述一个数学对象所需的参数个数。

数据类型:数值数据(numeric)、整数数据(Integer)、实数数据(real)、名义数据(nominal)、多项式数据(polynomial)(所有值中只有有限个类别)、二项式数据(binominal)(所有值只有俩个值,非A即B)、二值数据(binomial)(所有值只有两个数字,通常为0和1)。

算法:在数据挖掘过程中由基本运算及规定的运算顺序所构成的完整的解题步骤,例如决策树,聚类分析。

参数:每个挖掘算法都有一些提前要设置的内部变量,这些可以称之为参数。

流程:在数据挖掘中,采集数据并且进行算法的运算,最终导出结果的过程称为数据挖掘的流程。


03

数据挖掘标准流程及常用算法介绍

常用算法:常用算法包括以下几个大类:分类算法(决策树/ID3/C4.5等),聚类(K-mean算法、DBSCAN等),回归(线性回归、多项式回归等),关联

规则,时间序列分析,文本挖掘,Web挖掘等。

经典分类算法——朴素贝叶斯算法:

贝叶斯算法的应用非常广泛,银行中风险评估、客户类别分类、文本检索和搜索引擎分类、安全领域中的入侵检测以及软件项目中的应用等等。

其中P(A|B)是在B发生的情况下A发生的可能性。

 为完备事件组,即 Pr(A)是A的先验概率或边缘概率。之所以称为"先验"是因为它不考虑任何B方面的因素。

Pr(A|B)是已知B发生后A的条件概率,也由于得自B的取值而被称作A的后验概率。

Pr(B)是B的先验概率或边缘概率,也作标准化常量(normalized constant)。

按这些术语,Bayes法则可表述为:

后验概率 = (似然度 * 先验概率)/标准化常量

也就是说,后验概率与先验概率和似然度的乘积成正比。

对于变量有二个以上的情况:P(A|B,C)=P(B|A)*P(A)*P(C|A,B)/(P(B)*P(C|B))



分类

聚类

分类(Categorization or Classification)就是按照某种标准给对象贴标签 (label),再根据标签来区分归类;聚类是指事先没有“标签”而通过某种成团分析找出事物之间存在聚集性原因的过程。


K-means聚类算法:

(1)聚类学习任务:聚类算法是要将相似的对象放 入同一个聚簇,而将不相似的对象分到不同的 聚簇中。适用于众多难以获得标签数据的挖掘应用。

(2)K-means聚类过程描述:K为参数,需进行算法任务之前人为指定。 K-means算法将输入数据集D聚成K个簇, 然后输出聚簇代表集合C(k个,即中心点),聚 簇成员向量M。

(3)K-means算法的几个疑问: 局限性:K-均值算法依赖于初始值的选取, 贪婪下降求解算法仅能取得局部最优解, 未必能得到全局最优解。相同数据集如果 初始点不同,那么聚类收敛结果相差较大。参数K:经常被问到K选择多少更合适,首先, 这很困难。一般需要人为指定,如果让代价 函数最优那么聚簇个数和数据点个数一样时 代价为0,。SAS软件提供立方聚类准则,在代价函数基础上加上复杂性控制,从而确定K值。


数据处理

04


向上滑动阅览


1.如何引入数据挖掘

数据挖掘引入组织(公司): 首先,必须有一个明确定义的问题。其次,数据必须是可用的,相关的,适当的,干净的。结果必须是可操作的。

 

2.数据处理的地位

数据准备花费了50%以上的时间,而且挖掘项目越大,这个比例越高。数据挖掘部分占比仅10%,这和人们预测有些差距。数据分析的首尾两步骤商业目标和巩固结果应该是由数据分析人员和商业人员配合完成。

 

3.数据准备要素

(1)数据准备阶段两个核心任务:一.把数据组织成一种标准形式,以便于数据挖掘工具和其他基于计算机的工具处理(一般为数据库或者集群管理)二. 准备数据集,使其能得到最佳的数据挖掘效果。

注意:一.原始数据集并不总是数据挖掘的最佳数据集。初始数据集往往是包含丢失值、失真、错误值和不当样本等,如果没有这些特点,数据一般值得怀疑 。

二.原始数据集杂乱的原因:测量和记录都可能导致数据丢失,有些挖掘算法对于缺失值不敏感,有些相反,一般应先解决丢失问题;数据的错误记录,会导致“异常”值的出现,有些算法可以帮助找出异常点,一般为计算机程序执行。

4.原始数据转换

(1)数值缩放:缩放即将数值等比例缩小到一个指定区间,例如 【-1,1】和【0,1】。 例如数据变量中最大值25,最小值-125,那么整 体除1000即可,处理后的变量最大值为0.025,最小值为-0.125。

(2)最大—最小值映射法:前一方法适用于数据比较对称,分布较为离散,但 是分布相对集中的数据就要用到最大—最小值方 法 P_new=(P-MI)/(MA-MI) MI为最小值,MU为最大值

(3)标准差标准化:P_NEW=(P-AVG(P))/SD(P) 其中AVG(P)为变量均值,SD(P)为标准差 这个方法适用范围广,而且可以作为剔除异常值的参 考; 标准化的过程要注意全流程协同性,新数据也要进行

(4)数据平整:数据平整是在最小程度低减小信息损失的前提下大 幅度地降低数据集的数目 平整包括降低精度等方式,例如 {0.5566,0.5589,0.4534,0.4475}平整后可以是 {0.56,0.56,0.45,0.45},数据集数目减少明显。

 

5.数值离散化

(1)数据离散化:无论是处于对于数据集的精简,还是对于算法的应用,离散化都是我们要经常尝试进行的一种处理数据的方式。现在离散化的方式较多,有以下几种。

(2)离散化方法:

通过大小离散:指定离散后离散值内元素个数(每个组有几个元素)。 

通过分级离散:指定离散后离散组的个数。 

通过频率离散:按照数据频率分组,分成指定个数的组。 

通过用户规格离散:自定义离散化,指定特定组的取值范围。 

通过熵离散:通过熵来计算自动离散,会把“无用”变量删除(可选),可以把变量分成算法认为的最佳组个数。 实际中一般通过频率和熵离散较为常用,通过用户规格为高级分析师或者数据科学家常用。

6.数据缺失解决方案

当数据完整性的情况比我们想象的还要差时,对于小数据集,数据挖掘者和业务专家可以根据经验补齐缺失值;对于较大的数据集,有较为常见的方法,例如最大值—最小值替换,平均值替换,零值替换,自定义替换,这些替换方式简单实用,但是没有绝对的优劣,需要根据挖掘项目内容和数据特点来决定替换方案。

高级替换方案: 根据非确实变量和确实变量的关系来填补缺失值,这需要较为高级的预测方法,例如贝叶斯等。 高级方法缺点:如果缺失值都是用已知预测,那么即使补齐数据也未必能为挖掘提供更多信息,可看成信息冗余。

 

 7.异常点分析

数据异常点:在大型数据集中,通常有一些样本不符合数据模型的一般规则,这些样本叫做异常点。异常点会干扰数据挖掘在进行过程中正确规律的发现,有的数据挖掘过程会把异常点信息也拟合进去,造成一定程度的拟合过度。

数据异常点检测方法

异常点检测有以下几种方式 : 一.逻辑判断,例如年龄-1,这个数值一定是错误的。二.疑似错误值,年龄115,身高230CM,这类数据应该引起怀疑并且验证,属于常识(业务)规则判断。三.软件自动判断包括基于距离、基于密度、COF 判别等方法。

异常点自动检测方法:一.基于距离判断:需要指定邻域数量和异常点个数。二.基于密度判断:需要指定距离和比例。三.COF判别: 需要指定邻域数量和异常点个数。



05

变量处理

1.特征规约:特征规约即针对特定数据集进行变量数目的减少,所以特征规约一般针对的都是变量较多的数据集,如果变量数目P在10以下,一般对特征规约没有刚性需求,在P较大时,特征规约显得有很强的必要性。


2.特征规约方法:

(1)主成分分析法:较为常用的特征规约方法,可以在保留数据集一定信息的同时大规模减少变量数目,应用较广。

主成分分析: A1~An变量被处理成B1~Bm变 量,这里面m<n 。

(2)特征选择:可以在不破坏数据结构的前提下精简变量,目前越来越流行,是主成分分析的一个极佳的补充 。

特征选择: A1~An变量被处理成A1~An 其中的m个,这里面m<n 。

 

3.特征规约方法比较

主成分分析:适合于数值型数据,往往在保留 95%信息量的同时不降低模型质量,往往还会小幅提高模型质量,保留信息百分比是一个关键参数。

特征选择:算法上不如主成分分析成熟,容易有局部最优解,但是对于某些算法,确实可以大幅度地减少变量数目。

 

4.数值型变量处理

对于数值型数据,我们无法按照离散变量的方法来进行判断,但是我们有办法来判断该数值变量对标签变量的“影响”大小。这里我们用公式来计算

F=abs(L1-L2)*power(Var1/n1+Var2/n2 ,-0.5);

所有的数值型变量都可以按照这个方法来计算F值,F值越大,证明该变量越“重要”。


软件介绍

06


向上滑动阅览


(1)实质:分类算法实际上是根据个体属性来计算个体和类别的从属关系。

(2)过程:对于这个优秀的算法来讲,其实它的任务从来都是进行概率的分配,例如针对三个类别的分类任务,那么算法的主要任务就是将每个个体属于类别的可能性以概率形式表现出来。

(3)使用:我们对于分类算法的使用率可谓是十分低下,每一个分类算法都精准地将概率分配计算出来,而我们只利用了一个阈值来确定类别归属。

(4)前提:算法计算后,每个个体的置信度都在【0,1】区间,那么为了最大化利用这个“得之不易”的结果,我们其实可以自定义分组。

(5)分类任务中的数据平衡:

第一,将数据进行平衡,对比例高的类别进行筛选,让两类别尽量接近;

第二,将分类判定的概率阈值修改,修改阈值可以改变分类的归属,从而改变最终预测结果中两类别的比例;

第三,如果可以的话,将分类任务变为计算概率的问题,即变成回归问题,将每个样本属于类别的概率模拟出来,这样,就可以较为准确地利用这个概率做最终的决定。

*分级代替分类:事实上,有时候我们不仅需要知道用户的购买决定,还需要知道用户购买愿望的强烈程度,很明显,置信度是可以代表购买意愿的。

(1)自定义:可以根据实际需要对用户进行分级,例如按照置信度分为等距的10级。

(2)分级的意义:

解释:我们没有办法认为置信度为0.03的客户和置信度为0.47的客户对于我们是同样重要的;分级指导营销。

方便检验:在P4中,我们已经提到在普通的阈值下,置信度为0.5左右的用户被误判的可能性很大,所以按照分组来“整体观察”的话,会减少思考时间。


 MATLAB


向上滑动阅览


MATLAB 是美国Math Works公司出品的商业数学软件,用于算法开发、数据可视化、数据分析、矩阵计算以及非线性动态系统的建模和仿真等高级技术计算语言和交互式环境,主要包括MATLAB和Simulink两大部分。

 

重要功能:

·数值分析

·数值和符号计算

·工程与科学绘图

·控制系统的设计与仿真

·数字图像处理技术

·数字信号处理技术

 

优势特点

1)      高效的数值计算及符号计算功能,免去繁杂的数学运算分析

MATLAB是一个包含大量计算算法的集合。函数能解决矩阵运算和线性方程组的求解、微分方程及偏微分方程的组的求解、符号运算、傅立叶变换和数据的统计分析、工程中的优化问题、稀疏矩阵运算、复数的各种运算、初等数学运算、多维数组操作以及建模动态仿真等。

 

2)      完备的图形处理功能,计算结果和编程可视化

MATLAB具有方便的数据可视化功能,以将向量和矩阵用图形表现出来。高层次的作图包括二维和三维的可视化、图象处理、动画和表达式作图。例如图形的光照处理、色度处理以及四维数据的表现等。

 

3) 友好的用户界面、接近数学表达式的自然化语言,简单易用

MATLAB是一个高级的矩阵语言,用户界面接近Windows的标准界面,人机交互性强。它包含控制语句、函数、数据结构、输入和输出和面向对象编程特点。用户可以在命令窗口中将输入语句与执行命令同步,不必经过编译就可以直接运行;也可以先编写好一个较复杂的应用程序(M文件)后再一起运行。编程环境简单但调试系统完备,且能及时地报告出现的错误及出错原因。新版本的MATLAB语言是基于最为流行的C++语言基础上的,且更加简单,可移植性好,更利于非计算机专业的科技人员使用。

 

4) 功能丰富的应用工具箱

MATLAB对许多专门的领域都开发了功能强大的模块集和工具箱。它们都是由特定领域的专家开发的,用户可以直接使用工具箱学习、应用和评估不同的方法而不需要自己编写代码。

MATLAB 和 Simulink 的系统工具箱:

·Communications System Tool Sphere 解码器和 Constellation 框图系统对象

·Computer Vision System Toolbox™: 相机标定,立体视觉,Viola-Jones 对象检测培训,FREAK 特征提取和其他新函数

·DSP System Toolbox™: 频谱分析仪和逻辑分析示波器,以及时域示波器的触发

·Phased Array System Toolbox™: 极化支持、数组锥化以及针对传感器数组分析、波形分析和雷达方程计算的应用程序代码生成和实现

 

5)程序接口

MATLAB可利用MATLAB编译器和C/C++数学库和图形库,将自己的程序自动转换为独立于MATLAB运行的C/C++代码。用户可编写和MATLAB进行交互的C/C++语言程序。


SAS


向上滑动阅览


模块介绍

SAS由数十个专用模块构成,功能包括数据访问、数据储存及管理、应用开发、图形处理、数据分析、报告编制、运筹学方法、计量经济学与预测等等。

SAS系统基本上可以分为四大部分:SAS数据库部分;SAS分析核心;SAS开发呈现工具;SAS对分布处理模式的支持及其数据仓库设计。

SAS系统主要完成以数据为中心的四大任务:数据访问;数据管理( SAS的数据管理功能并不很出色,而是数据分析能力强大所以常常用微软的产品管理数据,再导成SAS数据格式.要注意与其他软件的配套使用);数据呈现;数据分析。当前(2016年)软件最高版本为SAS9.4。其中Base SAS模块是SAS系统的核心。其它各模块均在Base SAS提供的环境中运行。用户可选择需要的模块与Base SAS一起构成一个用户化的SAS系统。

 

软件特点

1)功能强大,统计方法齐,全,新

SAS提供了从基本统计数的计算到各种试验设计的方差分析,相关回归分析以及多变数分析的多种统计分析过程,几乎囊括了所有最新分析方法,其分析技术先进,可靠。分析方法的实现通过过程调用完成。许多过程同时提供了多种算法和选项。例如方差分析中的多重比较,提供了包括LSD,DUNCAN,TUKEY测验在内的10余种方法;回归分析提供了9种自变量选择的方法(如STEPWISE,BACKWARD,FORWARD,RSQUARE等)。

回归模型中可以选择是否包括截距,还可以事先指定一些包括在模型中的自变量字组(SUBSET)等。对于中间计算结果,可以全部输出,不输出或选择输出,也可存储到文件中供后续分析过程调用。

2)使用简便,操作灵活

SAS以一个通用的数据(DATA)产生数据集,尔后以不同的过程调用完成各种数据分析。其编程语句简洁,短小,通常只需很小的几句语句即可完成一些复杂的运算,得到满意的结果。结果输出以简明的英文给出提示,统计术语规范易懂,具有初步英语和统计基础即可。同时SAS的设计,使得任何SAS能够“猜”出的东西用户都不必告诉它(即无需设定),并且能自动修正一些小的错误(例如将DATA语句的DATA拼写成DATE,SAS将假设为DATA继续运行,仅在LOG中给出注释说明)。

对运行时的错误它尽可能地给出错误原因及改正方法。因而SAS将统计的科学,严谨和准确与便于使用者有机地结合起来,极大地方便了使用者。

3)提供联机帮助功能

使用过程中按下功能键F1,可随时获得帮助信息,得到简明的操作指导。


SPSS


向上滑动阅览


功能介绍

1)数据管理:

·超长变量名:在12版中,变量名最多可以为64个字符长度,13版中可能还要大大放宽这一限制,以达到对当今各种复杂数据仓库更好的兼容性。

·改进的Autorecode过程:该过程将可以使用自动编码模版,从而用户可以按自定义的顺序,而不是默认的ASCII码顺序进行变量值的重编码。另外Autorecode过程将可以同时对多个变量进行重编码,以提高分析效率。

·改进的日期/时间函数:本次的改进将集中在使得两个日期/时间差值的计算,以及对日期变量值的增减更为容易上。

2)结果报告

·统计图:在经过一年的使用后,新的常规图操作界面已基本完善,本次的改进除使得操作更为便捷外,还突出了两个重点。首先在常规图中引入更多的交互图功能,如图组(Paneled charts),带误差线的分类图形如误差线条图和线图,三维效果的简单、堆积和分段饼图等。其次是引入几种新的图形,已知的有人口金字塔和点密度图两种。

·统计表:几乎全部过程的输出都将会弃用文本,改为更美观的枢轴表。而且枢轴表的表现和易用性会得到进一步的提高,并加入了一些新的功能,如可以对统计量进行排序、在表格中合并/省略若干小类的输出等。此外,枢轴表将可以被直接导出到PowerPoint中,这些无疑都方便了用户的使用。

·统计建模

一般线形模型被完整地引入复杂抽样模块中,以实现对复杂抽样研究中各种连续性变量的建模预测功能,例如对市场调研中的客户满意度数据进行建模。对于分类数据,Logistic回归则将会被系统的引入。这样,对于一个任意复杂的抽样研究,如多阶段分层整群抽样,或者更复杂的PPS抽样,研究者都可以在该模块中实现从抽样设计、统计描述到复杂统计建模以发现影响因素的整个分析过程,方差分析模型、线形回归模型、Logistic回归模型等复杂的统计模型都可以加以使用,而操作方式将会和完全随机抽样数据的分析操作没有什么差别。

·模块

这个模块实际上就是将以前单独发行的SPSS AnswerTree软件整合进了SPSS平台。Classification Tree模块基于数据挖掘中发展起来的树结构模型对分类变量或连续变量进行预测,可以方便、快速的对样本进行细分,而不需要用户有太多的统计专业知识。在市场细分和数据挖掘中有较广泛的应用。已知该模块提供了CHAID、Exhaustive CHAID和C&RT三种算法。Tree模块在操作方式上采用的是交互式选项卡对话框。

·兼容性

在13版中,SPSS软件已经可以和其他一些最新的产品很好的整合在一起,形成更为完整的解决方案。例如,SPSS、SPSS Data Entry和新发布的SPSS Text Analysis for Surveys一起就形成了对调查研究的完整解决方案。而新增的SPSS Classification Trees模块将使得SPSS软件本身就能够针对市场细分工作提供更为完整的方法体系。

 

产品特点

1)操作简便

界面非常友好,除了数据录入及部分命令程序等少数输入工作需要键盘键入外,大多数操作可通过鼠标拖曳、点击“菜单”、“按钮”和“对话框”来完成。

2)编程方便

具有第四代语言的特点,只要了解统计分析的原理,无需通晓统计方法的各种算法,即可得到需要的统计分析结果。对于常见的统计方法,SPSS的命令语句、子命令及选择项的选择绝大部分由“对话框”的操作完成。

3)功能强大

具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。自带11种类型136个函数。SPSS提供了从简单的统计描述到复杂的多因素统计分析方法,比如数据的探索性分析、统计描述、列联表分析、二维相关、秩相关、偏相关、方差分析、非参数检验、多元回归、生存分析、协方差分析、判别分析、因子分析、聚类分析、非线性回归、Logistic回归等。

4)数据接口

能够读取及输出多种格式的文件。比如由dBASE、FoxBASE、FoxPRO产生的*.dbf文件,文本编辑器软件生成的ASCⅡ数据文件,Excel的*.xls文件等均可转换成可供分析的SPSS数据文件。能够把SPSS的图形转换为7种图形文件。结果可保存为*.txt及html格式的文件。

5)模块组合

SPSS for Windows软件分为若干功能模块。用户可以根据自己的分析需要和计算机的实际配置情况灵活选择。

 

功能模块

由17个功能模组组成:

Base System 基础程式

Advanced Models 高等统计模组(GEE/GLM/存活分析)

Regression Models 进阶回归模组

Custom Tables 多变量表格

Forecasting 时间序列分析

Categories 类别资料分析/多元尺度方法

Conjoint 联合分析

Exact Tests 精确检定

Missing Value Analysis 遗漏值分析

Neural Networks 类神经网络

Decision Trees 决策树

Data Preparation 资料准备

Complex Samples 抽样计划

Direct Marketing 直销行销模组

Bootstrapping 拔靴法

Data collection Data Entry 资料收集

Programmability Extension 扩充程式码能力


EXCEL


向上滑动阅览


可进行各种数据的处理、统计分析和辅助决策操作,广泛地应用于管理、统计财经、金融等众多领域。

 

主要功能

·电子表格

·图表

·数据库

1)表格处理  Excel的另一个突出的特点是采用表格方式管理数据,所有的数据、信息都以二维表格形式(工作表)管理,单元格中数据间的相互关系一目了然。从而使数据的处理和管理更直观、更方便、更易于理解。对于日常工作中常用的表格处理操作,例如,增加行、删除列、合并单元格、表格转置等操作,在Excel中均只需简单地通过菜单或工具按钮即可完成。此外Excel还提供了数据和公式的自动填充,表格格式的自动套用,自动求和,自动计算,记忆式输入,选择列表,自动更正,拼写检查,审核,排序和筛选等众多功能,可以帮助用户快速高效地建立、编辑、编排和管理各种表格。 

 

2)数据分析  除了能够方便地进行各种表格处理以外,Excel具有一般电子表格软件所不具备的强大的数据处理和数据分析功能。它提供了包括财务、日期与时间、数学与三角函数、统计、查找与引用、数据库、文本、逻辑和信息等九大类几百个内置函数,可以满足许多领域的数据处理与分析的要求。如果内置函数不能满足需要,还可以使用Excel内置的Visual Basic for Appication(也称作VBA)建立自定义函数。为了解决用户使用函数、编辑函数的困难,Excel还提供了方便的粘贴函数命令。它分门别类地列出了所有内置函数的名称、功能以及每个参数的意义和使用方法,并可以随时为用户提供帮助。除了具有一般数据库软件所提供的数据排序、筛选、查询、统计汇总等数据处理功能以外,Excel还提供了许多数据分析与辅助决策工具。例如数据透视表,模拟运算表,假设检验,方差分析,移动平均,指数平滑,回归分析,规划求解,多方案管理分析等工具。利用这些工具,不需掌握很深的数学计算方法,不需了解具体的求解技术细节,更不需编写程序,而只要正确地选择适当的参数,即可完成复杂的求解过程,得到相应的分析结果和完整的求解报告。 

 

3)图表制作  图表是提交数据处理结果的最佳形式。通过图表,可以直观地显示出数据的众多特征,例如数据的最大值、最小值、发展变化趋势、集中程度和离散程度等都可以在图表中直接反映出来。Excel具有很强的图表处理功能,可以方便地将工作表中的有关数据制作成专业化的图表。Excel提供的图表类型有条形图、柱形图、折线图、散点图、股价图以及多种复合图表和三维图表,且对每一种图表类型还提供了几种不同的自动套用图表格式,用户可以根据需要选择最有效的图表来展现数据。如果所提供的标准图表类型不能满足需要,用户还可以自定义图表类型。并可以对图表的标题、数值、坐标以及图例等各项目分别进行编辑,从而获得最佳的外观效果。Excel还能够自动建立数据与图表的联系,当数据增加或删除时,图表可以随数据变化而方便地更新。

 

4)宏功能  为了更好地发挥Excel的强大功能,提高使用Excel的工作效率,Excel还提供了宏的功能以及内置的VBA。用户可以使用它们创建自定义函数和自定义命令。特别是Excel提供的宏记录器,可以将用户的一系列操作记录下来,自动转换成由相应的VBA语句组成的宏命令。当以后用户需要执行这些操作时,直接运行这些宏即可。对于需要经常使用的宏,还可以将有关的宏与特定的自定义菜单命令或是工具按钮关联,以后只要选择相应的菜单命令或是单击相应的工具按钮即可完成上述操作。对于更高水平的用户,还可以利用Excel提供的VBA,在Excel的基础上开发完整的应用软件系统。



阅尽“数据分析”干货宝典

如果你是新手,必定已成功进阶;

如果你是大佬,也会有不同领悟。

点亮数据分析技能点的列位看官,

不打算组队来一波实践吗?

数据分析大赛将是你小试牛刀的最佳舞台!



左侧二维码:进入答疑群(群满可加工作人员微信13547608047)

右侧二维码:报名参赛(或点击阅读原文)

报名截止日期:11月13日

本篇推送下留言即可获得软件链接


留言点赞最多的两名贸大在校生可获得礼品

大赛冠名:凡普金科


编辑|方佳璇

责编|李玥晴


点击链接查看近期精彩文章

【秋日恋歌】半缘贸大半缘秋

【活动预告】“纪念一二·九运动“大型主题合唱比赛信院参赛选手招募

【第十九届IT文化节】岁月留声配音大赛奖品来袭(附比赛赛制)

——————————————————————————

友情链接

Copyright © 2023 All Rights Reserved 版权所有 香港腕表价格交流群