Bowwow


  • 首页

  • 关于

  • 标签

  • 分类

  • 归档

梁宁解读拼多多

发表于 2018-08-07 | 分类于 梁宁产品思维30讲 |

撑起拼多多的几大红利

  • 淘宝商家外溢
    当初淘宝、美团扫商家,已经有了基础,现在拼多多不需要一个楼一个楼去扫了,接收即可。低端供应链与低销人群如何安放。
  • 聚划算划归天猫
    之前千团大战已经证明人们喜欢团购的形式,但没有人做了。
  • 3-6线人群上网
    手机,移动支付。整个社会点线面体的整体升级。
  • 微信社交流量
    细到镇的物流已经成熟了。电商基因和游戏基因。

《主流经济学家比不了川普》

拼多多与淘宝、京东的几个不同

  • 起家生意的品类不一样
    拼多多排第一的是食品,淘宝女装,京东3C产品。战略选择:三级火箭
    先第一级吃亏构建势能,在第二级构建商业场景。
    高频打低频。微信推送 >搜索。食品>服装,电器。水果是个大生意吗?水果~旅游市场

  • 用户画像不一样 大明-百度、京东,笨笨-淘宝、美丽说,小闲-腾讯。腾讯本质上是游戏公司。拼多多能够把小闲用户转化为笨笨用户。美团:在打折里找我想吃的,点评:在附近找一找有没有我想吃的。拼多多做的是特价区。用户场景是去打折区看看哪个我想试一试的。

  • 开店难度不一样 发一个商品送一个店铺。用户的开店动机不一样。智能商业由算法驱动,货找人。如果能够直接工厂对消费者,其实是理想的商业模式。

产业终局与过程机会/过程原罪

  • 整合供应链,减少中间环节,扎扎实实地改变一下廉价消费品市场吧。
  • 终局:体验的平等。
  • 猜测和后续观察:黄峥会选择什么样的人为核心构筑企业价值网。市场的力量。
  • 颠覆式创新:把已经成熟的技术和能力拿回来,然后降低,提供给更广普的用户。在拼多多的用户里,你有没有看到100个颠覆式创新的机会?

消费升级的时代,所有的事情都值得重干一遍,成就你的其实是你的价值网。是谁在依赖你,这件事情才是本质。接着,你要有独立的判断能力。所有的东西都是资源,改变从我们今天开始。

商业经典案例课 皮克斯

发表于 2018-03-05 | 分类于 张潇雨的商业经典案例课 |

《创新公司》埃德·卡特穆尔

神来之笔与起死回生

皮克斯原本是乔治·卢卡斯电影工作室的一个部门,乔布斯以500万美元收购了这个部门。一开始乔布斯收购皮克斯的想法不是要做动画,而是想让它变成一家电脑公司,与NeXT相辅相成。结果皮克斯连续五六年都入不敷出。

约翰·拉塞特是一个讲故事的天才,他从迪士尼来到皮克斯,和团队做了两部很棒的短片。迪士尼邀请他回去,他要求迪士尼和皮克斯合作一部电影——迪士尼提供资金,皮克斯可以分到12.5%的票房收入。这部电影,就是让皮克斯起死回生的《玩具总动员》。

乔布斯在《玩具总动员》上映之前又做出了一个准确的判断——皮克斯要上市。因为如果电影一炮而红,迪士尼肯定要来重新谈判,试图把两家关系绑定得更紧。而皮克斯如果想在谈判中获得更大的利益,就要准备好充足的资金。

与迪士尼的天作之合

2006年1月迪士尼以74亿美元正式收购皮克斯。要促成这种大型的并购,往往要在人和事方面都合适。

先说事的层面。对于皮克斯,动画制作周期很长,收入很不稳定,风险也很大。它需要迪士尼一整套从制作到宣传到发行的产业链条,迪士尼也需要皮克斯强大的内容创造能力。

但人的因素也是巨大的。之前迪士尼的CEO埃斯纳和皮克斯以及乔布斯都相处得非常不好,他非常不尊重皮克斯的内容创造。后来鲍勃·伊格继任,他是一个为人和善、又非常真诚的CEO。最终促成了迪士尼和皮克斯的并购。

创意机器

好创意可能并不是天马行空、无拘无束才能产生出来,而是也能通过管理方法和机制的设立来促成的。

  • 消灭沟通层级,让员工畅所欲言
  • 好创业是不断迭代出来的

    “智囊团”——核心员工组成的一个委员会,看样片给这个电影的导演提意见。

    让所有人都能畅所欲言有两个重要的技巧:所有的讨论是对事不对人的。/提意见的人要做“有建设性的批评”。
  • 鼓励冒险

如何“管理”我的老板乔布斯

  • 了解你的老板

    彼得·格鲁克《管理的实践》《卓有成效的管理者》
  • 利用你的不可替代性,敢于像你的老板提要求。
  • 永远不要低估真诚和热情的力量。

无处不在的细节

  • 乔布斯大楼的设计方案中,蕴含了皮克斯的创意文化。乔布斯希望每个人都能聚到一起来,而不是被人为地分隔在不同的区域。所以设计成了一座只有两层、中间有个“中庭”的大楼,让不同部门的人碰面的机会大了很多。
  • 还有一个皮克斯用来保证自己创意文化的小举措——“考察旅行”。在筹备电影的阶段,针对电影的主题,皮克斯会安排自己的团队做针对性的实地考察。因为他们认为,动画电影营造出来的真实感,往往都在观众看不到的地方。
  • 在赶《玩具总动员2》时,一名员工不小心删除了数据,导致损失了两个月的进度。大家疯狂加班赶上了进度,而那个误操作的员工也完全没有受到责备。显示了皮克斯宽容的文化,以及超强的战斗力。

周末互动:找到你的热情

  • 热情是可以后天培养的。
  • 要学会识别你的“热情”背后的东西。
  • 给自己一点耐心。

商业经典案例课 苹果

发表于 2018-03-05 | 分类于 张潇雨的商业经典案例课 |

《史蒂夫·乔布斯传》《成为乔布斯》

乔布斯的职业生涯:

  • 创立苹果,到被苹果踢出局
  • 离开苹果之后,创立NeXT,同时收购了皮克斯动画工作室
  • 回归苹果

旗开得胜

乔布斯与好友史蒂夫·沃茨尼亚克先后开发出了“蓝盒子”、苹果一代、苹果二代,苹果二代一炮而红。

之后,乔布斯在施乐公司偷学到了图形交互界面GUI,放弃了苹果三代的开发,转而开发出了麦金塔电脑。

急转直下

  • 一个划时代的产品:麦金塔电脑(Macintosh)
    1984主题的麦金塔电脑广告和发布会都非常成功,但是产品本身有非常严重的缺陷。
  • 一个关键的人:约翰·斯卡利

    乔布斯和斯卡利不合,乔布斯想推翻斯卡利。
  • 一个关键的转折事件:苹果高管大会

    绝大多数的高管支持斯卡利,乔布斯正式辞职。

性格乔布斯

乔布斯为了做出心目中最好的产品,可以牺牲几乎所有的东西。

  • 不在意别人的想法
  • 不在意成本损失和上线时间的考量
  • 绝不冷血

风险投资的历史与哲学

阿瑟·洛克:风险投资个人的鼻祖

  • 要想获得超额的回报,一定是越早投资越好。
  • 投的不是产品或者行业,而是投人。

    唐·瓦伦丁和红杉资本:风险投资机构的标杆

  • 投资赛道,而不是骑手。

    瓦伦丁投资苹果的过程中,也帮助了乔布斯创建苹果。好的风投,可以积极地参与和帮助你整个创建公司的过程。

    风投是如何赚钱的

    投资的“幂法则”:一只基金的回报,几乎只由投资最成功的那一两家公司决定。所以风投不怕投错公司,只怕错过好公司。

乔布斯的魔力演讲

乔布斯的五个演讲技巧

  • 传达一个核心信息。只有一个。
  • 建立听众的共鸣。
  • 把数字形象化。
  • 提供口头路线图。
  • 赋予更宏大的意义。

周末互动:找刚需?刚需也可以被创造

  • 创业要找刚需,不要自己教育市场和创造需求。
  • 需求是可以被创造出来的。如果你做的这个产品,体验非常好,好到有了质的飞跃的时候,需求就可以被创造出来。
  • 关键在于正确定义“需求”
    • 第一,你要选择一个比较恒定的市场作为你的公司战略的最终战场。
    • 第二,你要每过一段时间,把对自己业务的理解向上抽象一个层次。

王者归来

乔布斯准备打造给企业和教育机构专门使用的电脑设备,成立了NeXT这家公司。但NeXT从来就没有成功过。

乔布斯还收购了皮克斯,但一开始并没有想让皮克斯做电影,而是配合NeXT开发一些3D软件。一段非常困难的时期之后,事情迎来了转机,皮克斯拍出了《玩家总动员》,公司也终于上市了。

1996年12月20日,苹果正式宣布收购NeXT,并且乔布斯以董事会顾问的身份回归。在1997至2000三年里,他做了三件非常重要的事:

  • 业务:业务重组。
- 台式 便携
消费 - -
专业 - -
  • 形象:品牌营销,”Think Different”
  • 人心:把员工期权的行权价格下调到13.81元,也就是当时的收盘价。

iPod:主动出击

2001年苹果推出了iPod,它具有两个历史性的意义:

  1. 这是苹果公司第一次从熟悉的电脑行业走出来,开始改造和影响另外一个行业,音乐行业。
  2. 苹果借由iPod,第一次走进了更大范围的大众消费领域,而且赢得了年轻人的心。

首先,乔布斯有了一个“数字中枢”的观念,即电脑会是家庭内很多电子设备的中枢。于是,他打算做个音乐播放器。就这样,乔布斯收购了一个小团队,做出了iTunes。
有了软件,还要有硬件。于是第一代iPod应运而生。
最后,乔布斯决定做一个数字音乐商店,彻底改变了整个音乐行业。

iPhone:改变一切

首先,iPhone改变了手机的定义。另一个层面上,由于iPhone的兴起,人类真正来到了“移动互联网”的时代。

iPhone带给我们的启示

  • 伟大的产品往往不是一蹴而就的。

    “多点触控”“金刚玻璃”“软键盘”……乔布斯和他领导的苹果,最伟大之处就在于,将最合适的技术组合在了一起,最终做出了改变世界的产品。
  • 伟大的产品可以有明显的缺陷,但要有更突出的优点。

    如果你的产品优点足够突出,用户其实是愿意忽略你很多不完美的地方的。生活中也是这个道理,有时候我们选择雇佣一个人,甚至喜欢一个人,往往不是因为他们缺点很少,而是由一些我们特别看重的优点。

乔布斯之死

为什么我们这个时代最聪明、最富有洞察力、最有远见的人,会输给这么一个本来并不严重的疾病呢?

因为他从来就是这么一个固执己见的人,坚持认为世界会按他的方式运转,完全不顾客观事实甚至扭曲现实的人。他在每件事情上都蔑视权威,不关心大众智慧。他总是坚持寻找自己的方法,然后乐观的相信他相信的事情会成功。

有时候这种固执让他赢得非常漂亮,但还有一些时候,这种固执让他输的同样惨烈。

从2009年做完肝移植手术,到2011年10月5日,乔布斯进入了人生的最后一个时期,把每一天当作生命的最后一天来活。他把所有时间都奉献给了两件他认为最重要的事情:苹果公司和他的家庭。

结尾与终章

  • “苹果”的由来

    乔布斯那一阵常去苹果园,并且在吃水果餐。另外苹果这个词比较柔和。A也靠前。
  • 第三个创始人

    罗恩韦恩
  • 音乐革命
  • 避免不同部门各自为战
  • Apple Score

    开在繁华地区/购物中心。

    店大,显示出品牌感。

    店能卖多少货不重要,重要的是消费者的体验。

周末互动:伟大产品与复杂人性

  • 作为一个初创的产品,有100个非常爱你的用户,要远远好过有10000个觉得你还不错的用户。
  • 事情往往没有我们想得那么简单。最重要的是,多去学习、了解、感受、体会。

理解苹果的三个关键认知

iPhone X的Face ID有什么意义?

苹果的未来:最大的AR公司

AirPods到底是什么?

公司的组织架构

商业经典案例课 英特尔

发表于 2018-03-05 | 分类于 张潇雨的商业经典案例课 |

《三位一体》

开启一切

三个关键词:八叛逆、仙童公司、硅谷

三个关键人物:威廉·肖克利、鲍勃·诺伊斯、戈登·摩尔

八个背叛了自己老板威廉·肖克利的员工,包括鲍勃·诺伊斯和戈登·摩尔,在阿瑟·洛克的帮助下,联系到了仙童公司,成立了仙童半导体公司,算是仙童的全资子公司。

公司形势一开始不错,但由于仙童公司的问题和电子产业的周期性衰退,仙童半导体盛极而衰。诺伊斯和摩尔决定出走,创立了英特尔。

仙童半导体的倒塌也催生了湾区许多以“硅”为核心材料的半导体公司,硅谷由此诞生了。

硅谷文化的奠基者

  • 技术至上与人才至上的企业文化
  • 摩尔定律对整个行业的推动
  • 英特尔对硅谷的投资和融资行业的影响

伟大又微妙的三巨头

  • 戈登·摩尔:思考的人

    性格和蔼可亲,非常谦虚。
  • 鲍勃·诺伊斯:对外的人

    脾气很好、待人友善版的乔布斯,有“硅谷市长”之名。
  • 安迪·格鲁夫:行动的人

    强硬、凶悍、激进、果断。“硅谷最伟大的管理者”

绝境逢生安德鲁

《格鲁夫给经理人上的第一课》《只有偏执狂才能生存》

安迪·格鲁夫性格强悍,敢于在关键时刻豪赌。

  • 20世纪80年代初左右,行业又一次崩溃,安德鲁却加大投资,度过了危机也打败了保守的对手
  • 1984年左右,格鲁夫下定决心关闭存储器业务,进行战略转型。

“等灯等灯”

  • Intel:Intergrated Electronics的缩写
  • 极致工艺
  • 人人平等
  • “等灯等灯”:1991年左右,Intel Inside广告。
  • 开枝散叶的仙童半导体:1到92

香帅的北大金融学课 金融学专题

发表于 2018-03-05 | 分类于 香帅的北大金融学课 |

市场有效悖论

  • 市场是否有效是一个极具争议的话题,市场有效悖论是一切金融理论的基石,是金融学当中理性学派与行为学派的分界线。
  • 市场有效是一个动态均衡的过程,它不可能是完全有效的,也不太可能是非常无效的,这两种情况都不可持续,而是一种接近有效的状态。
  • 对于大多数人而言应该借助专业力量去购买基金进行投资,而不是自己去操作股票。因为市场高度有效,就没有那么多容易得到的盈利机会。

    行为金融学

  • 行为金融学就通过研究人们的认知和决策过程,研究人们在金融市场上的判断与决策,以及这些决策形成的金融市场上的重要现象。
  • 行为金融学作为金融学一个重要的分支学科,分为有限理性和有限套利两部分。有限理性说的是,由于人们的认知过程会产生很多偏差,所以价格是有误差的,市场的定价不是完全有效的。有限套利说的是,套利过程有很多成本和风险,当面临这样的成本和风险时,套利者有所顾忌、不敢下手,因此套利也是有限的。
  • 行为金融学带给我们两个启示,我们既需要时刻反思自身的局限,又需要考虑市场是否发生了系统性偏差。

    经济学与金融学之若即若离

  • 经济学与金融学在学科性质、研究假设、研究视角和学习方法上均有不同。
学科 经济学 金融学
学科性质 基础学科 应用学科
研究假设 限定条件之下的优化 突破现有的边界条件进行跨时空的财富管理
研究视角 国师之道 百姓之学
学习方法 广泛涉猎,全局把握 注重实际问题的解决和案例学习

达里奥的桥水基金

  • 主流的宏观经济预测模型分为向量自回归和结构化模型两类,其本质就是用一套方程描述历史,再通过趋势外推进行预测。
  • 桥水基金认为债务是危机的本质,桥水基金对债务情形的准确计算使得其在危机中逆势获得超高收益。
  • 虽然桥水基金的债务分析方法在危机时刻能够大显神通,但其日常投资业绩并不突出。

《机器学习》第二章 模型评估与选择

发表于 2018-03-02 | 分类于 机器学习 |

经验误差与过拟合

错误率(error rate):$E=\frac{a}{m}$

精度(accuracy):$1-\frac{a}{m}$

误差(error):学习器的实际预测输出与样本的真实输出之间的差异

训练误差(training error)/经验误差(empirical error):学习器在训练集上的误差

泛化误差(generalization):学习器在新样本上的误差

过拟合(overfitting):学习器把训练样本自身的一些特点当作了所有潜在样本都会具有的一般性质,导致泛化性能下降

欠拟合(underfitting):对训练样本的一些性质尚未学好

模型选择(model selection)

评估方法

测试集(testing set)

测试误差(testing error)

通过对数据集D进行适当的处理,从中产生出训练集S和测试集T

留出法

“留出法”(hold-out)直接将数据集D划分为两个互斥的集合,一个作为训练集S,另一个作为测试集T。

训练/测试集的 划分要尽可能保持数据分布的一致性,可采取分层采样。使用留出法时,一般采用若干次随机划分、重复进行实验评估后取平均值作为流出法的评估结果。常见做法是将大约2/3~4/5的样本用于训练,剩余样本用于测试。

交叉验证法

“交叉验证法”(cross validation)先将数据集D随机p次划分为k个大小相似的互斥子集,每个子集都尽可能保持数据分布的一致性,即从D中通过分层采样得到。然后每次用k-1个子集的并集作为训练集,余下的那个子集作为测试集,共进行k-1组测试。称为“p次k折交叉验证”。

留一法(Leave-One-Out),令k=数据集中的样本数。

自助法

“自助法”(bootstrapping),以自助采样法(bootstrap sampling)为基础,给定包含m个样本的数据集D,对它进行采样得到数据集D’:每次随机从D中挑选一个样本,将其拷贝放入D’,然后再将该样本放回初始数据集D中,使得该样本在下次采样时仍有可能被采到;这个过程重复执行m次后,就得到了包含m个样本的数据集D’。样本在m次采样中始终不被采到的概率是$${\lim_{m \to +\infty}}(1-\frac{1}{m})^m \mapsto \frac{1}{e}\approx 0.368$$

将D’作为训练集,D\D’作为测试集。这样的测试结果,亦称“包外估计”(out-of-bag estimate)

调参与最终模型

“调参”(parameter tuning),一般对每个参数设置一个范围和变化步长,产生几个候选值,从几个候选值中产生选定值。

在模型选择完成后,学习算法和参数设置已选定,此时应该用数据集D重新训练模型。

性能度量

性能度量(performance measure):衡量模型泛化能力的评价标准

设样例集$D = { ( x_1, y_1), (x_2, y_2), … , (x_m, y_m) }$

回归任务常用“均方误差”(mean squared error)

$$E(f; D) = \frac{1}{m}\sum_{i=1}^{m}(f(x_i) - y_i )^2$$

更一般的形式为$$E(f; D) = \int_{x \sim D}(f(x) - y)^2 p(x) dx$$

错误率与精度

错误率$$E(f; D) = \frac{1}{m}\sum_{i=1}^{m} \mathbb I (f(x_i) \neq y_i )$$

更一般的形式为$$E(f; D) = \int_{x \sim D} \mathbb I (f(x) \neq y) p(x) dx$$

精度$$E(f; D) = \frac{1}{m}\sum_{i=1}^{m} \mathbb I (f(x_i) = y_i )$$

更一般的形式为$$E(f; D) = \int_{x \sim D} \mathbb I (f(x) = y) p(x) dx$$

查准率、查全率与F1

TP:真正例;FN:假反例;FP:假正例;TN:真反例

“查准率”(precision)$P=\frac{TP}{TP+FP}$

“查全率”(recall) $R=\frac{TP}{TP+FN}$

P-R图直观地展示出学习器在样本总体上的查全率、查准率,一般比较P-R曲线下面积的大小,但不太容易估算,所以人们设计了一些综合考虑查准率、查全率的性能度量。

$“平衡点”(Break-Even Point, 简称BEP):$“查准率”等于“查全率”时的取值.

$F1:$查全率和查准率的调和平均值.

$$F1=\frac{2\times P \times R}{P+R}=\frac{2\times TP}{样例总数+TP-TN}$$

$F_\beta:$查全率和查准率的加权调和平均值.

$$F_\beta=\frac{(1+\beta^2)\times P \times R}{( \beta^2 \times P) + R}$$

在n个二分类混淆矩阵上综合考察查准率和查全率

第一种方法是在各混淆矩阵上分别计算出查准率和查全率,再计算平均值,称为“宏查准率(macro-P)”“宏查全率(macro-R)”“宏F1(macro-F1)”.

第二种方法是将各混淆矩阵的对应元素进行平均,得到TP、FP、TN、FN的平均值,再基于这些平均值计算出“微查准率(micro-P)”“微查全率(micro-R)”“微F1(micro-F1)”.

ROC与AUC

“ROC曲线”(Receiver Operating Characteristic)

很多学习器是为测试样本产生一个实值或概率预测,然后将这个预测值与一个分类阈值(threshold)进行比较,大于阈值则分为正类,否则为反类。根据这个实值或概率预测结果,我们可将测试样本进行排序,“最可能”是正例的排在最前面,“最不可能”是正例的排在最后面。而在不同的应用任务中,我们可根据任务需求来采用不同的“截断点”(cut point)。而排序的质量好坏,体现了综合考虑学习器在不同任务下“期望泛化性能”的好坏,ROC曲线则是从这个角度出发研究学习器泛化性能的工具。

根据学习器的预测结果对样例进行排序,按此顺序逐个把样本作为正例进行预测,以“真正例率”(True Positive Rate,简称TPR)作为纵轴,“假正例率”(False Positive Rate,简称FPR)作为横轴,得到“ROC曲线”。

“AUC”(Area Under ROC Curve)

ROC曲线下的面积

$$AUC = \frac{1}{2} \sum_{i=1}^{m-1} (x_i+1 - x_i) \times (y_i + y_i+1)$$

$$AUC = 1 - l_{rank} $$

代价敏感错误率与代价曲线

不同类型的错误造成的后果不同,可为错误赋予“非均等代价”(unequal cost),设定“代价矩阵”(cost matrix)。注意,一般情况下重要的是cost01和cost10的比值。

“代价敏感”(cost-sensitive)错误率为

$$E(f; D; cost) = \frac{1}{m} \sum_{x_i \in D^+} \mathbb I (f(x_i) \neq y_i ) \times cost_{01} + \frac{1}{m} \sum_{x_i \in D^-} \mathbb I (f(x_i) \neq y_i ) \times cost_{10}$$

此时采取“代价曲线”(cost curve)而非ROC曲线反映学习器的总体期望代价。

横轴为取值为[0, 1] 的正例概率代价

$$P(+)cost = \frac{p \times cost_{01}}{p \times cost_{01} + (1 - p) \times cost_{10}}$$

纵轴为取值为[0, 1] 的归一化代价

$$cost_{norm} = \frac{FNR \times p \times cost_{01} + FPR \times (1 - p) \times cost_{10}}{p \times cost_{01} + (1 - p) \times cost_{10}}$$

比较检验

基于假设检验,我们可推断出,若在测试集上观测到学习器A比B好,则A的泛化性能是否在统计意义上优于B,以及这个结论的把握有多大。

假设检验

$ 泛化错误率\epsilon $

$ 测试错误率\widehat{ \epsilon } $

“二项检验”(binomial test)$ P( \widehat{ \epsilon }; \epsilon ) = \begin{pmatrix} m \ \widehat{ \epsilon } \times m \end{pmatrix} \epsilon^{ \widehat{ \epsilon} \times m} ( 1 - \epsilon)^{m - \widehat{ \epsilon} \times m} $

“t检验”(t-test)$ \tau_t = \frac{ \sqrt{k}( \mu - \epsilon_0 ) }{ \sigma } \sim t( k - 1) $

交叉验证T检验

k折交叉验证“成对t检验”(paired t-tests)

基本思想:若两个学习器的性能相同,则它们使用相同的训练/测试集得到的测试错误率应相同

先对两个学习器A和B每对测试错误率求差值,再根据差值做t检验

$$ \tau_t = \left| \frac{ \sqrt{k} \mu}{ \sigma } \right| \sim t(n - 1) $$

MCNEMAR 检验

FRIEDMAN 检验 与 NEMENYI 后续检验

偏差与方差

《机器学习》第一章 绪论

发表于 2018-03-02 | 分类于 机器学习 |

引言

模型(model):从数据中取得的结果,全局/局部.

学习算法(learning algorithm):在计算机上从数据中产生“模型”的算法.

基本术语

数据集(data set):一组数据的集合.

示例(instance)/样本(simple)/特征向量(feature vector):关于一个事件或对象的描述.

属性(attribute)/特征(feature):反映事件或对象在某方面的表现或性质的事项.

属性值(attribute value):属性上的取值.

属性空间(attribute space)/样本空间(simple space)/输入空间:属性张成的空间.

维数(dimensionality):一个样本属性的个数.

学习(learning)/训练(training):从数据中学得模型的过程.

训练数据(training data):训练中使用的数据.

训练样本(training simple)/训练示例(training instance):训练数据的每组样本.

训练集(training simple):训练样本的集合.

假设(hypothesis):学得的模型.

真相/真实(ground-truth):学得的模型对于的关于数据的某种潜在规律.

学习器(learner):学习算法在给定数据和参数空间的实例化.

预测(projection)

标记(label):训练样本的“结果”信息.

样例(simple):有标记信息的示例,如$(x_i, y_i)$

标记空间(label space)/输出空间:所有标记的集合.

分类(classification):预测离散值的学习任务.

回归(regression):预测连续值的学习任务.

二分类(binary classification):只涉及两个类别的分类,正类(positive class)/反类(negative class).

多分类(multi-class classification):涉及多个类别的分类.

预测任务是希望通过对训练集${(x_1, y_1), (x_2, y_2), …… , (x_m, y_m) } $进行学习,建立一个从输入空间Χ到输出空间Υ的映射 f:Χ→Υ, Υ的大小根据预测目标而定.

测试(testing):学得模型后,使用其进行预测的过程.

测试样本(testing simple):被预测的样本.

聚类(clustering):将训练集分为若干组.

簇(cluster):聚类分成的一个组.

监督学习(supervised learning):训练数据具有标记信息的学习任务,如分类、回归.

无监督学习(unsupervised learning):训练数据不具有标记信息的学习任务,如聚类.

泛化(generalization):学得模型适用于新样本的能力.

分布(distribution)

独立同分布(independent and identically distributed)

假设空间

归纳(induction):从特殊到一般的“泛化”(generalization)过程,从具体的事实归结出一般性规律.

演绎(deduction):从一般到特殊的“特化”(specialization)过程,从基础原理推演出具体状况.

归纳学习(inductive learning)

学习过程是在所有假设(hypothesis)组成的空间中进行搜索的过程,搜索目标是找到与训练集“匹配”(fit)的假设.

版本空间(version space);多个与训练集一致的假设构成的集合.

归纳偏好

归纳偏好(inductive bias):机器学习算法在学习过程中对某种类型假设的偏好.

特征选择(feature selection):对哪种特征更重视.

奥卡姆剃刀(Occam’s razor):若有多个假设与观察一致,则选最简单的那个.

没有免费的午餐(No Free Lunch Theorem/NFL):假设所有“问题”出现的机会相等,所有学习算法的期望性能相同。——脱离实际问题,空泛地谈论“什么学习算法更好毫无意义”.

发展历程

1950-1970:“推理期”,赋予机器逻辑推理能力.
1970s中期:“知识期”,知识工程,建立专家系统
1950s中后期出现:“连接主义”,包括感知机、adaline
1960-1970:“符号主义”(symbolism)学习,包括“决策树”(decision tree)和基于逻辑的学习(归纳逻辑程序设计Inductive Logic Programming,简称ILP).
1990中期之前:基于神经网络的“连接主义”(connectionism)学习,如BP算法.
1990:“统计学习”(statistical learning),如支持向量机(Support Vector Machine,简称SVM)以及更一般的“核方法”(kernal methods).
2000:连接主义卷土重来,“深度学习”,狭义地说就是“很多层”的神经网络。模型复杂度高,以至于只要下功夫调参,把参数调节好,性能往往就好.

应用现状

大数据时代的三大关键技术:机器学习提供数据分析能力,云计算提供数据处理能力,众包(crowdsourcing)提供数据标记能力.

数据挖掘(data mining):从海量数据中发掘知识,机器学习和数据库是其两大支撑.

阅读材料

重要会议及期刊

机器学习

国际机器学习会议(ICML)、国际神经信息处理会议系统会议(NIPS)和国际学习理论会议(COLT)

欧洲机器学习会议(ECML)和亚洲机器学习会议(ACML)

中国机器学习大会(CCML)以及每年举行的“机器学习及其应用”研讨会(MLA).

Journal of Machine Learning Research和Machine Learning

人工智能

IJCAI、AAAI

Artificial Intelligence、Journal of Artificial Intelligence Research

数据挖掘

KDD、ICDM

ACM Transsactions on Knowledge Discovery from Data、Data Mining and Knowledge Discovery

计算机视觉与模式识别

CVPR

IEEE Transactions on Pattern Analysis and Machine Intelligence

5.神经网络

Neural Computation、IEEE Transactions on Neural Networks and Learning Systems

P.S.统计学Annals of Statistic

致新博客

发表于 2018-03-02 |

一年前搞的annmk.cn濒临过期,于是打起了新建一个博客的主意。一年以来,东西没搞多少,心却越来越大。希望之后,心能踏实点,能选定方向就好好做。

以下算是是给之前博客的开场语,也有我为什么要搞博客的原因。我既能在一年前的自己上看到自卑、焦虑、敏感,也能看到倔强、努力和不服输。

感谢自己。


一开始知道网协是在军训的宣讲会上。宣传PPT做得很好看,技术部和网络部听起来也相当高大上。

关注了微信公众号,看了很久推送,认真地写了申请书,犹豫很久点了提交。然后怀着蜜汁自信,没有报其他组织。

跟李倩妤聊天,我说我想进网协,她说你去认识一下网协的人,聊聊天。我想了很久不知如何开口。

面试,和婧婧一起去的。非常紧张。 我记得那天还走错了教室,进到理教发现原来地点在宗教,又急急忙忙赶过去。隐约能回想起是张晨阳带我和婧婧去的教室,面试我的是唐回峰和?。当天聊的还可以,蜜汁自信更强烈了。

然后就是十一出结果,没有回复。为此抑郁了一段时间。

接着认识马艺展,去了一次网协办公室。准确的说是两次。第一次去,一开始貌似在开会,浩浩荡荡一大堆人,然后开心散会。我犹豫很久没有进,在旁边桌子上自习了一个晚上。第二次去鼓足勇气,装了vs和matlab,认识了杨绮璇、陈宇婷她们。当天是王元玮和李东值班。

然后诊所外场去了,尬聊了一会儿。

微软Dell的广告活动也去了。并不知道有什么意义,现在想来这种广告也就只能是广告。

c语言模拟去了,A的题很惨淡……有几道感觉没问题但一直交不对……可能现在看也都是水题吧。

c语言串讲去了,复习了基本都知道的概念,讲了那么几个题型。

数学建模前一天窝在网协蹭网,和张晨阳、马艺展一起。

寒假搞了几天vpn和十几天acm。

下学期又去网协请教vpn,遇见了石竞川,一起复印了大批实验报告并熟悉了起来。麻烦贾泽瑞给我搞了半天vpn,结果最后也没有弄出什么,非常抱歉。

之后感谢张晨阳推荐,我终于混入了网协,加入了执念的技术部。我都觉得我是不是有斯德哥尔摩综合症了,要么就是有受虐倾向,怎么就没有那种“什么!你不要我!我就不要你了!”的豪迈气概呢。

面试,王元玮和陈天杰,尬聊了一会儿人生,接着知道了技术部之后要搞网页开发,跟着杨绮璇的小组开了例会,很开心。

之后是我不努力了,是我的问题。没有好好刷题也没有好好搞网页开发,一事无成。中间去听了一次unity。还挺有趣,感觉上手不难。但是也没有下功夫做。最后网页设计结题的组会没有去,因为有学业指导中心的例会。

之后因为没有加群,一直不知道有例会存在,就没有去过。前一段时间去网协蹭网才得知没加群,然而已经开始换届了。

我问了张晨阳很多关于网协的问题,还旁听了一次外联部的例会,再一次,认真地写了申请书。

但是我真的有点不高兴了,我明明很努力了为什么参加网协就是这么艰难呢!再一次想质问为什么!凭什么!

从两方面分析这个问题①我的能力不配②中间出了差错

我选择性忽视①地自我感觉良好。

昨天问了王元玮我凭什么申请,得到了“凭你漂亮吧”的回答。

?????!!!!!

爆炸……..

分析了一下我的内在矛盾心理

①我这么有能力你跟我说脸???!!!

②我确实没能力,想象自己有能力是骗人的,醒醒吧!!!

分析了一下对方心理

①烦死了什么都不会还申请!!!我对你的印象只有脸了!!!

②这么严肃的问题我说一说白烂话活跃一下吧!!!

行吧…….

不过凭这句话,估计能打很久的鸡血了。

想放松时,别忘了别人会说,你走到现在,大概是凭你的漂亮吧。

于是今天5点多醒了,看完了金旭亮的知乎live笔记了一下。弄了几个小时网站后去F2N做志愿者。

回家晚上8点多,又搞了几小时搞出了这个网站。


今天网协换届面试终于结束了,之前花了那么多心思做ppt、写演讲稿,那么希望能够留下来,好像突然也没所谓了。

原来部长团和主席团一共有那么多人,很多人我不认识。我知道有些人对我抱有莫名的敌意,可能我说了他们部门不好的话吧。人就是这样很矛盾,你让别人讲缺点,真的讲出来你就面对不了了。还有的属于本能感觉气场不合,那也没办法。可能很多人还是客气了,没说什么,其实我很希望他们能多说点,我真的很想交流。之前我没有机会交流,好不容易才这么一次呢。

啊,原来这就是网协,这种感觉今天又出现了。网协就是这样,说好听叫随性,说难听叫不靠谱,还有无数的关系错综复杂,偏见、冷漠、偏执。可能因为我运气不好,都撞见了。

更新一下对世界的概念吧,怎么能信奉美好、信奉公平、信奉真实呢?你太单纯了,你的努力和认真是最不重要的东西。

但是我还是不愿意放弃。

可能是因为我也见过网协温暖的一面吧,我固执地认为这一面存在。

就这样吧,要是这样也不要我,我没什么可说的。这烂摊子我还懒得搞呢,自己玩儿去吧。

没心思刷概率题和离散题,随便搞了一会儿HTML、CSS。网页真的很有趣啊,我想做网页,但是要学的好多,除了这俩还有JS、数据库等等。慢慢来吧。


昨天网协换届结果终于出了!!!虽然早就知道了并不意外还是蜜汁开心!!!

晚上六点半综B-201开会,结果下午三四点才发短信,果然是个要倒闭的组织……..

先是技术部学了两个月unity就开始当老师的陈老板讲话,中间一度面临时间闪回的尴尬,然后王老板中途插话,又强调了一定要搞联谊!联!谊!两………两周一次?我……..

然后诊所讲话,唐回峰一直在卖萌啊啊啊,这真是个捉摸不透的男人………诊所绿也很好看嘛你们为什么不喜欢绿色啦!

接着组织部讲话,虽然又是一度翻车不过潘达岩大大凭借高超的口才和诊所的模板(?)强行拉了一波情怀,扳回一城~

然后贾老板讲了网络部的事,说实话网络部的事情应该是最多的了!又是直播又是做项目还要带部员!虽然最后也稍稍翻了车,但是比倒闭的技术部还是好一点~

啊啊啊啊啊啊啊树莓上了!这ppt做的真好看!字体都好想要啊啊啊啊啊!我觉得树莓部长还是很能想的呢,眼光长远,就是不知道之后行不行。

主席黄俊伟最后总结了一下网协的一年,放了一大波黑照!但是为什么要放我和易翔宇面试的照片呢……..

接着就是建群交接,组织部可能没什么要交接的吧反正挺闲…….话说什么时候把钥匙给我啊啊啊?

加了技术部和网络部的群卧底www

然后回寝室其实才是聊天的开始!加了一波人,和黄俊伟、张晨阳、王元玮都聊了聊,深感打字速度不足……..和王老板聊了漫展和美食,还挺开心的,之后网协要出去轰趴?王老板貌似对鳗鱼饭很感兴趣,假期可以约一下~

香帅的北大金融学课 春节房地产特辑

发表于 2018-03-02 | 分类于 香帅的北大金融学课 |

首次置业:刚需房如何选择?

  • 这些年中国房价的快速上涨根源在于快速的经济增长和城市化,符合全球范围内的一般规律。
  • 中国房价还有很大上涨空间,并不是泡沫。
  • 政府调控房价,调控的不是房价的水平,而是房价的增速。
  • 刚需买房时,要遵循“先上车原则”(不需要一步到位,先买个买得起的小房子,再找机会换大房子)和“稀缺原则”(尽量买城市中心的房子)。

    渐入佳境:改善房怎么选择?

  • 改善型住房,不仅仅是改善居住条件,更重要的是改善家庭的财富状况。
  • 综合考虑我国的经济增长、城市化水平和人口基数这三大红利,未来我国的改善型住房还可以继续帮助改善我们的财富状况。
  • 房产收益率高、安全、易于投资,是比惧怕和债券更好的投资工具,适合长期配置。
  • 购买改善型住房时,一定要尽量使用公积金贷款和长期贷款,减少支付压力,对抗通货膨胀。

    百岁人生,养老房让你老有所依

  • 在长寿时代,养老买房不仅仅是为了居住,更重要的是买一份资产,是老有所依的一份保障。
  • 挑选国内城市买房养老,要考虑八大因素,分为四个常见的已知要素(城市规模、人口流入、人均收入、土地供应)和四个不太常见的关键要素(儿童数量的增速、上市公司的数量、财政收入、服务业占比),也是决定房价的八大要素。
  • 国外的房子并不便宜,投资回报率也不高,投资价值并不大。

    租房VS买房,一个决策改变未来

  • 由于房租的高速增长,买房比租房要便宜很多,而不是相反
  • 买房是一次性买断未来很多年的租金和通胀,具有抗通胀的性质
  • 暂时买不起房,必须租的话,要遵循“便利原则”,组那些让工作便利的房子,投资自己。

香帅的北大金融学课 二 金融中介机构(投行)

发表于 2018-03-02 | 分类于 香帅的北大金融学课 |

投资银行;改变市场生态的新物种

发行承销

- 投资银行:不做“银行业务”的银行
  • 投资银行不是商业银行,它不做存贷汇业务,只专注于证券市场上的“投资业务”,也叫券商。投资银行的主要业务:发行承销、兼并收购、零售经济、资产证券化、量化投资等。
  • 大萧条之前,商业银行和投资银行混业经营,它们之间没有防火墙(储户的钱流入股市,助长股市泡沫);危机之后政府要求二者严格分开,实施分业经营,由此诞生了独立的投资银行。
  • 证券市场投资者风险自担,投资银行受到的监管比较宽松,因此比较善于进行金融创新,由投行诞生了货币基金、风头创投等新业务。
    - 发行承销(上):投资市场上的婚介中心
    发行承销:投资银行利由专业知识帮助企业设计融资产品和方式、选址发行地点并利用营销网络把证券产品卖出去。

    发行承销业务实力的关键:
  • 人脉实力
  • 专业知识
    - 发行承销(下):怎么才能把证券卖出去?
  • 招股说明书,面向投资者和监管机构披露关于公司的财务、优点、特点等信息以吸引他们的注意力。
  • 投资对于企业的包装营销。(人脉、专业)
  • 把握监管层意图、与监管层有效沟通。(中国)
    - 延展话题:谷歌上市记
    Google上市的过程,投行的角色被大大削弱,企业完全地掌握了主动权。原因是我们的时代正由资本为王的时代转变为企业和企业家精神为王的时代。

    兼并收购

    - 兼并收购:企业的二手交易市场
  • 并购的目的:通过资产重组来提高效率、实现价值。
  • 并购创造价值的模式:规模和协同效应、风险分散效应、突出主营业务和强强联合。
  • 投资银行利用自身资源和专业知识发明创造了兼并收购的各种模式,并推动着并购业务的发展进步。
    投资银行在兼并收购中的作用:
  1. 通过战略眼光发现价值创造的机会。
  2. 利用资源和知识来整合、推动兼并收购过程。
    兼并收购业务所需的专业知识:
  3. 资产评估
  4. 会计、审计
  5. 法律和监管
  6. 有关企业的专业知识
    - 杠杆并购:华尔街的金融游戏
  • 杠杆收购就是借钱买企业,四两拨千斤地取得企业所有权,它使得企业主、投资银行、借款人三方共赢——
  1. 企业主在套现的同时保留了经营权
  2. 投资银行在短时间实现极高的年化回报率
  3. 借款人获得稳定的利息收入。
  • 杠杆收购能够实现多方共赢,但公司需要具备充沛现金流、靠谱管理层、适中杠杆率三个条件。
  • 杠杆收购既不是天使也魔鬼,要具体情况分析。杠杆收购成功了能够实现三方共赢,负债率过高则会拖垮企业。
    - 毒丸计划:如何抵御门口的野蛮人
  • 兼并收购包括协议和恶意两类,前者发生在双方情投意合的情况下,而后者发生在购买方未经目标公司允许的情况下。
  • 为了应对恶意收购,企业可以根据所处的不同法律环境选择使用“毒丸计划”或白衣骑士等具体策略。
  • 反并购与你我息息相关:作为中小投资者我们可能在反并购站中获得超高的短期收益,作为创业者我们也应该学会这些反收购的策略进行自保。
    - 延展话题:创始人怎么用较少的钱控制上市公司?
  • 双重股权结构。
  • 投行联合承销。分散投行权利,使企业对投行的依赖越来越少。

    金融创新(上)

    - 零售经纪:中产阶级,到我这儿买股票吧
  • 零售经纪是投资银行转型的开始,它改变了金融市场者结构(平民化、普及化)和投资银行自身的业务模式(资产管理业务、增值服务)。
  • 零售经纪赚钱的方式就是收取佣金。虽然每一笔数额很小,但是中国人口多、交易频繁,最终的佣金数量非常可观。
  • 经济业务在大国外投行的收入占比已低于 10% ,而中国券商对零售经纪的依赖还比较大,业务创新能力还有待提高。
    - 垃圾债券:巴菲特的秘密武器
  • 垃圾债:风险比较高、收益也比较高的债券。分为“堕落天使”和“小天使”
  • 垃圾债本身是中性的,它既开辟了高风险小企业融资新途径,也在利率上行的背景下压垮了许多参与杠杆收购公司。
  • 目前中国的垃圾债市场还没有形成规模,但随着经济从高速增长逐渐转为中高速增长,我国的小企业私募债可能会有较大发展空间。
    - 量化交易:诺奖得主也会掉进的坑
  • 量化交易就是依靠计算机程序实施投资策略的方法 ,这种策略一方面收益极高,另一方面也可能导致市场短期内大幅震荡。
  • 量化交易建立在计算机技术、金融理论和财富管理总量迅速发展的基础上,它的原理就是利用计算机技术克服人的弱点、寻找钱的规律。
  • 量化交易在规律稳定的时候可以获得很高收益,但是如果发生了巨大变化而策略又没有能及时调整,则会带来巨大的损失。
  • 中国的量化交易尚处于一个萌芽状态,这既是由次贷危机引发人们对量化的反思,也是因为中国金融市场还未发展成熟。
    - 延展话题:如何正确认识形形色色的“金融创新”?
    金融创新需要过硬的金融逻辑和充足的现实条件。
  • 智能投顾:根据大数据来对每股客户进行动态的风险测评,再根据客户的风险偏好推荐最“合身”的股票债券或者投资组合。
  • 机器人选股:量化交易
  • P2P平台:为个体与个体之间的网络借贷提供信息中介的公司。
    - 本周问答:如何判断人民币汇率走向?
    过去两年半的时间里,人民币兑美元坐了一次过山车,从6.2到6.9,又升值到6.3左右。
    引起汇率波动的根本原因,是美元。而美元大幅波动,有两个最关键的因素:

    1.美元加息。美联储开启加息周期,刺激美元大幅升值。加息停止之后,美元的升值压力消退。

    2.全球经济复苏。2016年下半年开始,全球经济开始复苏。2017年全球经济强劲复苏,风险资产受到追捧,原来不被看好的欧元等其他货币,受到追捧。

    理解汇率走势,长期看趋势,短期看波动。

金融创新(下)

- 资产证券化(上):给我一个现金流,我就将它证券化
  • 资产证券化(ABS)是将一组流动性差但预计能产生稳定现金的资产进行分割和重组,转换为流动性信用等级较高的金融品的过程,如“蚂蚁花呗”、“京东白条”。
  • 资产证券化作为重要的金融创新,造了巨大流动性连通直接和间接融资市场,是20世纪80年代以来金融深化的最大推手。
  • 资产证券化的应用范围非常广,涉及到我们的衣食住行。比较著名的包括基础设施项目收益权证券化和REITs。
    - 资产证券化(下):美国梦与次贷危机
  • 2001年后美国政府以房地产部门为支点刺激经济,房贷质量急转直下,房屋抵押贷款证券化风靡,房地产泡沫不断膨胀;2004年到2006年政策突然收紧,泡沫破裂,引发连锁反应,导致金融危机。
  • 华尔街设计了种种复杂的交易结构,将低质量的次贷层层包装向市场发售,最终底层资产大量违约触发了美国次贷危机。
  • 资产证券化作为金融工具是中性的,但在运用过程必须注意把控基础资产质量、防止过度的再证券化。
  • 根据我国的房贷质量和再证券化发展程度考虑,目前我国由房贷资产证券化触发次贷危机的可能性很小。
    - 现金贷是中国版次贷危机吗?
  • 现金贷是一个没有“消费场景”的纯信用款,它与房贷、车贷、信用卡贷款的主要区别在于贷款机构是否知道贷款人的借钱目的。
  • 本轮现金贷是从2016年开始形成规模效应的,它的兴起与P2P平台有这千丝万缕的联系,做的就是短期、小额、方便快捷的高利贷生意。
  • 现金贷的资产证券化将低质量、高风险打包加装以后卖到金融市场上,有可能引起违约风险在体系的蔓延。
    - 延展话题:投资银行:金融世界里的“异形”
    投行的业务非常纷繁复杂,但是有两条主线可以概括它的整个演化过程:
  1. 资金面从稀缺到富裕,投行的业务也从以融资为主变成了以投资为主。
  2. 投行的业务创新和监管的变化相互博弈,相互促进,投资银行和商业银行的业务也分久必合、合久必分。
12
Annmk

Annmk

13 日志
5 分类
14 标签
© 2018 Annmk
由 Hexo 强力驱动
|
主题 — NexT.Gemini v5.1.4