1. 首页
  2. 网络营销赋能
  3. 海外营销

SEO和数据分析的Excel统计

每个人都可能已经意识到几乎没有我们无法获得的数据。我们可以使用免费工具获取有关我们网站的数据,但我们也花费大量资金购买付费工具以获得更多。分析竞争同样容易,竞争情报工具无处不在,我们经常使用Compete或Hitwise。打开Site Explorer非常适合获取有关我们和竞争对手反向链接配置文件的更多数据。无论我们想要获得什么信息,我们都可以通过花钱或没钱来获得。我最喜欢的部分是几乎每个工具都有一个共同的功能,那就是“导出”按钮。这是所有这些工具中最强大的功能,因为通过将数据导出到Excel中,我们可以对其进行排序,过滤并以我们想要的任何方式对其进行建模。我们大多数人经常使用Excel,我们熟悉基本功能,但Excel可以做更多的事情。在下面的文章中,我将尝试介绍最常见的统计技术,最好的部分是我们不必记住复杂的统计方程式,它是Excel内置的一切!

统计数据是关于收集,分析和解释数据的。当决策面临不确定性时,它非常方便。通过使用统计数据,我们可以克服这些情况并生成可操作的分析。

统计分为两个主要分支,描述性推理性

当您知道数据集中的所有值时,将使用描述性统计信息。例如,您对1000人进行调查,询问他们是否喜欢橙子,有两种选择(是和否)。你收集结果,你发现900回答是,100回答否。你发现比例90%是是10是不是很简单吧?

但是当我们无法观察到所有数据时会发生什么?

当您只知道部分数据时,必须使用推论统计。当您只知道数据中的一个样本(一小部分)并且您对整个群体(数据)进行猜测时,就会使用推理统计。

我们考虑您要计算过去24个月的电子邮件开放率,但您只有过去六个月的数据。在这种情况下,假设从1000封电子邮件中有200人打开电子邮件,导致800封电子邮件未转换。这相当于20%的开放率和80%的未开放率。这个数据在过去的六个月中都是正确的,但在24个月内可能并非如此。推论统计有助于我们了解我们与整个人口的距离以及我们对此假设的信心。

样本的开放率可能是20%,但可能会略有不同。因此,在这种情况下,我们考虑+ – 3%,范围从17%到23%。这听起来不错,但我们对这些数据有多大信心?或者,从整个人口(数据集)中取出的随机样本的百分比将落在17%-23%的范围内?

在统计中,95%置信水平被认为是可靠数据。这意味着我们从整个人口中获得的95%的样本数据将产生17-23%的开放率,另外5%将高于23%或低于17%。但我们95%确定开放率为20%+ – 3%

术语数据代表描述对象或事件(如访问者,调查,电子邮件)的任何值。

术语数据集有两个组成部分,观察单位,例如访问者和可以代表访问者人口统计特征的变量,如年龄,工资或教育水平。人口是指您组中的每个成员,或者是网络分析中的所有访问者。我们假设有10,000名访客。

一个样本只有你的人口的一部分,根据日期范围,游客谁转换等,但在统计数据中最有价值的样本被认为是随机抽样。

所述数据分配是通过与在数据的值设定发生的频率给出。通过在图表上绘制频率,水平轴上的值范围和垂直轴上的频率,我们获得分布曲线。最常用的分布是正态分布或钟形曲线。

SEO和数据分析的Excel统计

理解这一点的简单方法是考虑网站的访问者数量。例如,访问次数平均为2000次/天,但碰巧有更多的访问次数,例如3000次或更少1000次。

在这里,概率论派上用场了。

概率代表事件发生的可能性,例如每天有3,000名访客,并以百分比表示。

可能每个人都知道的概率最常见的例子是硬币翻转。硬币有两个面,头部和尾部,翻转硬币头部的概率是多少?那么有两种可能性,所以100%/ 2 = 50%。

足够理论,让我们更实际一点。

Excel是一个很棒的工具,可以帮助我们统计数据,它不是最好的,但我们都知道如何使用它,所以让我们直接进入它。

首先,安装Analysis ToolPack。
打开Excel,转到选项 – >加载项 – >,我们将在底部找到

SEO和数据分析的Excel统计

点击Go – >选择Analysis ToolPack->并单击OK。

现在,在Data选项卡下,我们将找到Data Analysis。

SEO和数据分析的Excel统计

数据分析工具可以为您提供超级精彩的统计信息,但首先让我们从更简单的开始。

平均值,中位数和模式

均值平均值的统计含义,例如4,5,6的平均值或平均值是5我们如何计算excel的平均值?=平均(数字1,数字,等)

SEO和数据分析的Excel统计

平均值= AVERAGE(AC16:AC21)

通过计算平均值,我们知道平均销售量。当没有极端值(或异常值)时,此信息很有用。为什么?看起来我们平均售价3000美元的产品,但实际上我们很幸运,有人在9月6日花了更多。但实际上我们在过去的六天里做得很差,平均只有618美元。从均值中排除极值可以反映出更相关的绩效率。

中值是位于数据集的中间的观察。例如,224,298,304的中位数是298.为了计算大量数据的平均值,我们可以使用以下公式= MEDIAN(224,298,304)

中位数何时有用?好吧,当你有一个偏斜的分布时,中位数是有用的,例如你卖3美元到15美元一袋的糖果,但你有一些非常昂贵的糖果100美元的袋子,没有人真正定期购买。在你月底你必须做一个报告,你会发现你卖的大多是便宜的糖果,只有100美元的几个。在这种情况下,计算中位数更有益。

确定何时使用中位数与平均值的最简单方法是创建直方图。如果您的直方图偏向极端,那么您知道最好的方法是计算中位数。

SEO和数据分析的Excel统计

模式是最常见的值,例如用于模式:4,6,7,7,7,7,9,10是7

在Excel中,您可以使用= MODE(4,6,7,7,7,7,9,10)公式计算模式。

虽然这看起来不错保持记住,在Excel中最低的模式被认为是,或者换句话说,如果你要计算模式下的数据集2,2,2, 4,5,6,7,7,7,8,9你可以看到你有两种模式,2和7,但Excel只显示最小的值:2。

我们什么时候可以使用模式功能?计算模式仅对整数(如1,2和3)有用。对于分数,例如1,744,它没有用; 2.443; 3,323,因为有重复数字或模式的机会非常小。

计算模式或最常用数字的一个很好的例子可能是调查。

直方图

假设您的博客最近收到了数百个客座帖子,其中一些非常好,但其中一些并不是那么好。也许你想看看有多少博文收到了10个反向链接,20个,30个等等,或者你对社交分享感兴趣,比如推文或喜欢,但为什么不只是简单的访问。

在这里,我们将使用称为直方图的直观表示将它们分组。在这个例子中,我将使用访问/文章作为一个简单的例子。我设置Google Analytics帐户的方式如下。我有一个只跟踪我的博客的个人资料,没有别的。如果您还没有这样的配置文件设置,那么您可以动态创建一个段。

你好吗?很简单:

SEO和数据分析的Excel统计

现在转到export-> CSV

打开excel电子表格并删除除着陆页和访问之外的所有列。现在创建要分类的范围(也称为容器)。假设我们想看看有多少文章产生了100次访问,300次,500次等等。

得到数据 – >数据分析 – >直方图 – >好的

SEO和数据分析的Excel统计

  • 输入范围将是访问列
  • Bin Range将成为团体
  • 输出范围,单击要显示直方图的单元格
  • 检查图表输出
  • 单击确定

SEO和数据分析的Excel统计

现在,您有一个很好的直方图,可以显示按访问分类的文章数量。为了更容易理解此直方图,请单击“Bin”和“频率”表中的任何单元格,然后将频率从低到高排序。

SEO和数据分析的Excel统计

现在分析数据更容易。现在返回并在上个月对所有文章进行少于或等于100次访问的排序(访问下拉菜单 – >数字过滤器 – >介于… 0-100->确定之间)并更新或推广它们。

按来源访问

这份报告对你有多大价值?

SEO和数据分析的Excel统计

这很不错但并不令人惊讶。我们可以看到起伏不定但是…… 2月份YouTube总共访问了多少?您可以向下钻取,但这是额外的工作,当问题通过与客户的电话联系时非常不舒服。要充分利用图表,请创建有价值的自描述报告。

SEO和数据分析的Excel统计

上面的报告更容易理解。创建它需要更多时间,但它更具可操作性。

我们可以看到,在5月份,Facebook对总数的贡献大于一般。怎么会?可能5月的营销活动比其他月份更有效,导致大量流量。回去再做一次!如果它是一个有效的解决方案,那么重复它。

如果您认为五月只是偶然的机会比其他几个月更大,那么您应该创建一个卡方检验,以确保访问量的增加不是偶然的,并且从统计上证明了您的广告系列的有效性。

SEO和数据分析的Excel统计

实际列是访问次数,预期列是“实际”列的平均值(平均值)。卡方检验的公式为= 1-CHITEST(N10:N16,O10:O16),其中N10:N16是来自Actual的值,O10:O16是来自Expected的值。

100%的结果是您认为每月投入的工作会影响来自Facebook的访客数量时的信心水平。

创建指标时,要使它们尽可能简单易懂,并与业务模型相关。每个人都应该了解你的报告。

下面的视频很好地解释了卡方功能的另一个例子:http//www.youtube.com/watch?v =OPawNLQOv-8

预测的移动平均线性和线性回归

SEO和数据分析的Excel统计

我们经常看到如上图所示的图形。它可以代表销售或访问,它并不重要,它不断上下。我们可能希望消除数据中的大量噪音以产生更好的理解。

解决方案,均线!这种技术有时被交易者用于预测,股票价格在一天内蓬勃发展,但在第二天他们正在触底。

让我们看看我们如何使用他们的基本技术使它适合我们。

第1步:
导出以获得长时间访问/销售的数量,例如一年或两年。

SEO和数据分析的Excel统计

第2步:
转到数据 – >数据分析 – >移动平均 – >确定

SEO和数据分析的Excel统计

输入范围将是具有访问次数的列

间隔将是创建平均值的天数。在这里你应该创建一个具有较高数字的移动平均线,例如30,而另一个具有较小数字的移动平均线,例如7。

输出范围将是访问列旁边的列。

SEO和数据分析的Excel统计

重复这些步骤,间隔为7天

个人偏好:我没有故意检查图表输出和标准错误框,稍后我会创建一个图表。

您现在的数据可能与此类似:

SEO和数据分析的Excel统计

现在,如果您选择所有列并创建折线图,它将如下所示:

SEO和数据分析的Excel统计

这种表示具有较少的噪音,更容易阅读并且显示出一些趋势,绿线在图表中稍微清理一下,但它对几乎所有重大事件都有反应。相反,红线更稳定,显示出真正的趋势。

在折线图的末尾,您可以看到它显示预测。这是基于先前趋势的预测数据。

在Excel中,有两种创建线性回归的方法,使用公式= FORECAST(x,known_y’s,known_x’s),其中“ x”代表您要预测的日期,“known_y’s”是访问列,“known_x’s”是日期栏。这种技术并不复杂,但有一种更简单的方法可以做到这一点。

通过选择整个访问列并向下拖动字段句柄,它将自动预测以下日期。

SEO和数据分析的Excel统计

注意:确保选择整个数据集以生成准确的数据集。

比较7天移动平均线和30天时有一个理论。如上所述,7天线对几乎所有重大变化作出反应,而30天线则需要更多时间来改变其方向。根据经验,当7天移动平均线与30日移动平均线相交时,您可以预期会发生一个持续时间超过一两天的重大变化。正如你在4月6日左右所看到的那样,7天移动平均线与30天移动平均线相交,访问次数正在下降,6月6日左右线路再次穿越,趋势正在上升。当您丢失流量并且您还不确定它是否只是趋势还是仅仅是每日波动时,此技术非常有用。

趋势线

使用excel的趋势线功能可以获得相同的结果:右键单击摆动线 – >选择:添加趋势线

SEO和数据分析的Excel统计

现在您可以选择回归类型,也可以使用预测功能。趋势线可能是最有用的,可以确定您的流量/销售额是向上,向下还是仅仅持平。

没有线性函数,我们无法自信地判断我们是否做得更好。通过添加线性趋势线,我们可以看到斜率为正,趋势线方程解释了我们的趋势如何变化。
Y = 0.5516x-9541.2

X表示天数。系数x,0.5516是正数。这意味着趋势线正在上升。换句话说,每过一天我们就增加0.5的访客数量作为趋势。

R ^ 2表示模型的准确度。我们的R ^ 2数是0.26,这意味着我们的模型解释了26%的变化。简单地说:我们有26%的信心,每隔一天,我们的访客人数会增加一位新访客。

SEO和数据分析的Excel统计

季节性预测

圣诞节即将到来,预测冬季可能是有益的,尤其是当您的期望很高时。

如果您没有被Panda或Penguin击中并且您的销售/访客遵循季节性趋势,那么您可以预测销售或访客的模式。

季节性预测是一种技术,使我们能够估计遵循重复变化的数据集的未来值。季节性数据集无处不在,夏季期间冰淇淋店将非常有利可图,礼品店可以在冬季假期达到最大销量。

对不久的将来预测数据非常有益,特别是当我们计划在这些季节的营销中投入资金时。

以下示例是基本模型,但可以将其扩展为更复杂的模型以适合您的业务模型。

下载Excel预测示例

我将把这个过程分解为更容易理解的步骤。为您的企业实施它的最佳方法是下载Excel电子表格并按照以下步骤操作:

  • 导出数据,您拥有的数据越多,您可以做出更好的预测!并将日期放入A列并将销售额放入B列。
  • 计算每个月的索引并在C列中添加数据

为了计算电子表格右下方向下滚动的索引,您将找到一个名为Index的表。2009年1月的指数是通过将2009年1月的销售额除以2009年全年的平均销售额计算得出的。

SEO和数据分析的Excel统计

重复计算每年每个月的指数。

在列S38至S51中,我们计算了每个月的平均指数

SEO和数据分析的Excel统计

因为我们的季节性是每12个月一次,所以我们将索引均值一次又一次地复制到C列中。如您所见,2009年1月的指数数据与2010年1月和2011年相同

SEO和数据分析的Excel统计

  • 在列d计算调整后通过将每月的数据销售索引 = B10 / C10
  • 选择A,B和D列中的值并创建折线图
  • 选择调整后的线(在我的情况下为红线)并添加线性趋势线,选中“在图表上显示方程式”框

SEO和数据分析的Excel统计

  • 通过将每月销售额乘以trandline方程中的系数并从等式中添加常数来计算反向非季节性数据(E列)

创建趋势线后,我们在图表上显示公式,我们考虑系数乘以X的数字和常数通常具有负号的常数。

SEO和数据分析的Excel统计

我们将系数放入细胞E2,将恒定放入细胞F2

  • 通过将索引(C列)与先前计算的数据(E列)相乘来计算Backcasted Seasonal数据
  • 通过将销售额除以季节性减去1(= B10 / F10-1)来计算MPE(平均百分比误差)
  • 通过平方MPE列(= G10 ^ 2)计算MAPE(平均调整百分比误差)

SEO和数据分析的Excel统计

在我的案例中,单元格F50和F51代表2012年11月和2012年12月的预测数据。单元格H52表示误差范围。

通过使用这种技术,我们可以说在2012年12月,我们将赚取22,022美元+ – 3.11%。现在去找你的老板,告诉他如何预测未来。

标准偏差

标准差告诉我们我们偏离平均值的多少,换句话说,我们可以将其解释为置信水平。例如,如果您有月销售额,则每天的每日销售额会有所不同。然后,您可以使用标准差来计算您与月平均值的偏差。

您可以使用Excel中的两个标准偏差公式。
= stdev-当您有样本数据时 – > Avinash Kaushik更详细地解释了抽样的工作原理http://www.kaushik.net/avinash/web-analytics-data-sampling-411/

要么

= stdevp-当你拥有整个人口时,换句话说,你正在分析每个访客。我的个人偏好是= stdev只是因为有些情况下没有执行JS跟踪代码。

让我们看看我们如何在日常生活中应用标准偏差

SEO和数据分析的Excel统计

您可能每天都会在分析中看到扭曲的图形,但它不是很直观。通过在Excel中使用标准差,您可以轻松地查看和更好地了解数据发生的情况。正如您在上面所看到的,平均每日访问量为501,标准差为53,也是最重要的,您可以看到超出正常范围的位置,这样您就可以返回并查看哪些营销活动导致了这种峰值。

对于Excel文档,请使用以下链接http://blog.instantcognition.com/wp-content/uploads/2007/01/controllimits_final.xls

关联

相关性是一个变量变化与另一个变量相关的趋势。网站分析中的一个常见示例可以是访问者数量和销售数量。您拥有的合格访客越多,销售额就越多。皮特博士有一个很好的信息图解释相关性与因果关系https://moz.com/blog/correlation-vs-causation-mathographic

在Excel中,我们使用以下公式来确定相关性:
= correl(x,y)
SEO和数据分析的Excel统计

如您所见,我们在Visits和Sales之间存在0.1的相关性。这是什么意思?

  • 在0和0.3之间被认为是弱的
  • 介于0.3和0.7之间是正常的
  • 0.7以上很强

我们的结论是,每日访问不会影响每日销售,这也意味着您吸引的访客不符合转换条件。在做出决定时,您还必须考虑您的商业意识。但0.1的相关性不容忽视。

如果要关联三个或更多数据集,可以使用数据分析工具中的关联函数。

数据 – >数据分析 – >相关性

SEO和数据分析的Excel统计

您的结果将与此类似:
SEO和数据分析的Excel统计

我们在这里看到的是,没有一个元素彼此相关:

  • 销售额和访客= 0.1的相关性
  • 销售和社会份额=相关系数为0.23
  • 用于快速分析的描述性统计

现在您对平均值,标准偏差等有了很好的理解,但计算每个统计元素可能需要很长时间。数据分析工具提供了最常见元素的快速摘要。

  • 转到数据 – >数据分析 – >描述性统计
  • 输入范围 – 选择要分析的数据
  • 输出范围 – 选择要在其中显示表格的单元格
  • 检查摘要统计

SEO和数据分析的Excel统计

结果非常好:

SEO和数据分析的Excel统计

你已经了解了大部分元素,但这里新出现的是Kurtosis和Skewness

Kurtosis解释曲线与平均值的峰值有多远,换句话说,峰度值越高,峰值越大,在我们的例子中,峰度是一个非常低的数字,这意味着值均匀分布

Skewness解释了您的数据是否与正态分布呈负相关或正向偏差。现在让我更直观地向您展示我的意思:

SEO和数据分析的Excel统计

Skeweness:-0.28(分布更可能面向更高的值2500和3000)
峰度:-0.47(我们与中心的峰值偏差非常小)

这些是您在分析数据时可以使用的一些技术,统计和Excel背后的最大挑战是在各种情况下应用这些技术的能力,而不仅限于访问或销售。Tom Anthony在他关于链接配置文件工具的帖子中实现了一起实现的多种统计方法的一个很好的例子。

上面的例子只是统计数据和Excel可以完成的一小部分。如果您正在使用其他技术来帮助您做出更快更好的决策,我很乐意在评论部分听到它们。

本文来自投稿,不代表穷思笔记立场,如若转载,请注明出处:https://www.chons.cn/14418.html

发表评论

登录后才能评论

联系我们

 

在线咨询:点击这里给我发消息

邮件:2267450086@qq.com

QR code