虽然同为数据分析,但各种类的数据分析有他特性跟缺陷
例如我们在财务预估分析中,对于风险的发生会采用水位管控,不同水位下对应不同的风险在大数据分析,会更着重于数据的线性跟交互性链上数据主要的目的是推论各种价格的相关性,这些数据分成市场交易的技术面,市场价值的消息面等等,由这些面向构成的数据意义自然也会有对应的缺陷。这些缺点我们分成以下几点来说明1. 历史数据的依赖性:价格是一种市场现象,因此我们会基于过去的市场数据来做出预测。但是市场是不断变化的,过去的模式不一定能准确预测未来的情况。就像过去的天气情况不一定能准确预测明天的天气一样。而且历史是累积变化的一个过程,就像2009年的熊牛跟现在的熊牛不同,我们可以说某些数据模型在推测脱离熊谷还能用,但在爬坡动力那段可能就不适用了。2. 无法考虑所有因素:每种模型可能只关注特定的几个指标或数据,而忽略了其他可能影响市场的因素。原因很简单,因为把所有事情考量进去的模型,不是模型,是神之模型。(这其实是一个编程的梗,类似冷笑话,看不懂就跳过)如果要让模型成立,就必然要删除主观觉得干扰的数据。除了数据干扰,还有消息面的干扰,包括全球经济状况、政治事件、市场情绪等。一旦消息面的影响力发生,避险是个好选择,不过你要选择逆风而上也可以,毕竟血流成河之时,也是机会涌现之日。这现象很容易理解,就像从数据看到明明资本都要撤场了,突然某个国家说「采用比特币作为合法货币」,就会引发情绪性的暴涨。这种情绪性暴涨会随着发生次数,作用逐渐下降。话说回来,越成熟的市场,这类的现象频率越低。3. 数据延迟性:模型既然是使用过去的数据来计算指标,因此存在一定的延迟。在市场快速变动的情况下,工具可能无法及时反应市场的变化。举个例子,假设一个工具使用过去的30天数据来计算指标,而在这30天内市场经历了剧烈波动。这种情况下,工具可能无法准确反映最新的市场情况,投资者可能错过了买入或卖出的最佳时机。不过这一点倒是还好,通常大家会交互四到六个模型来比对,假设分成七天,30天,111天,200天四种模型比对,就比较不容易陷入延迟性的盲区中。4. 风险管理影响决策:模型并不提供「买入买出」信号,投资操作实际上是资金跟风险运用的决策过程,模型能做的是提供参考,而非决策。简单来说就是,当你有1000倍资金做杠杆,即便10%的情绪性暴涨你也不会在乎,但是如果你只有一倍资金,即便模型出现的是买入信号,但你可能扛不住一次的意外。很多交易教学都会说什么买入卖出信号,但是在数据分析的领域,决策跟分析并不是同一件事,决策包括赌可能性,也就是说假设信号没出现,但是期望值够高,或是抗压能力高,操作者还是可能会做出买入或卖出的动作。
不管是哪种数据分析,最重要的就是避险,不是只有交易的部分才需要避险。例如我现在从国外进一批货,商品数量是在安全水位的范围内,我有极大的机率可以三个月内几乎卖完这批货,而且不会发生商品短缺的问题。但同时我会考虑万一发生任何没卖掉的状况,例如市场有水货窜入,或是有同质性竟品的出现,所以我会同时制定好要观察哪些数据,一旦这些额外的参考数据脱出预估范围,立刻启动备案甚至第二备案。关于财务方面的数据分析,等我把链上数据分析的基本课程都写完再来写。数据分析的乐趣在于把现实量化,并透过量化后的可推演性来达成可验算复盘及复制性,有机会再慢慢讲到这个
今天先这样了。