新型的事件驱动与大数据投资应用

Discussion in 'Philosophy and Strategy' started by kuhasu, Jul 18, 2013.

  1. 谁大谁小真的那么重要吗? 闻道有先后,达者为师! 西蒙斯1938生人,1978下海,1982年创立文艺复兴, 这个坛子上哪位敢说比他强?
     
  2. 跟年龄根本没关系。:D
    早年间我就看出ku一定能成为资本大鳄,现在看,我的眼光是极好的!:cool:
    比我还牛的人,年轻却很谦虚,这点很难得,通常这个年龄这个成就的,尾巴早翘到天上了。我估计还会有大发展,就是不清楚他到底怎么想的。:p
    你们谁想让我看看?
     
    Darren likes this.
  3. 但是ku这次讲难了,整个华人金融圈儿估计没几个能真正看懂的,觉得懂真正实施起来都是很难的领域。
     
  4. 楼上这位托真敬业,逢场必到。实在受不了。
     
  5. 反对造神运动!我只是想多做点儿实事,希望老兄能真帮我,指不足,研实务。谢谢!
     
  6. tony是对冲从业者,做得好像也不错,见过一面,应该不是托,况且托不托也没用,没人是傻子。捧得高摔得重。
     
  7. 席梦思早先研究基本面,后来碰到了做量化投资的,才开窍,把量化进行应用。
    希望话题能回到主题《新型的事件驱动与大数据投资应用》,谢谢~
     
  8. 咱们都是天津人,一起能混到华尔街,我不顶你我顶谁?:mad:
    你看不出来那个人一直针对你?虽然人不遭嫉妄为才,你也有点儿脾气好不好!
    你分享的干货,myym不领情还埋汰你,你就不气!?:mad:什么玩意儿!:mad:

    http://www.oceantribe.org/vb/showthread.php?t=21051&page=3
    http://www.oceantribe.org/vb/showthread.php?t=38018
     
  9. 题外话。

    符合下面至少一条应该算大数据应用了:
    或者在1TB内存里面运行内存数据库,
    或者有100TB整合的数据,
    或者并行100台以上的服务器。

    大多数人不要说应用,搞到这么多数据都困难。
     
  10. 老兄请不要着急,稍安毋躁,论坛里讨论问题没必要着急~
    我觉得myym兄之前那些还算正常,没神马,就算真有神马,也不会影响到现实中什么,没关系的。
    我决定分享的,肯定有我的考量,心里有数,你知道我比猴儿都灵的,而且既然决定分享,觉得就大大方方的不怕人看,分享给所有人都能看,说实话我也想看看反馈意见。不同人有不同想法我觉得是挺正常的事儿~
    还劳烦老兄为我“出头”,我觉得挺过意不去的。:)
    总之我还是觉得和为贵,现实生活中盈利才是真格的。:)
     
  11. 这才是正题。。。
    不一定非得如此大的硬件配备或者数据量。
    国外的技术早就成熟,数据获取有网络爬虫,新闻和交易信息终端有提供新闻数据接口或者远程实时数据库供数据源连接。国内的信息也比较成熟了,就我了解到的情况,普遍延时在3-5分钟定向信息,这方面还的确有差距,但是硬件配备和分布式处理的成本却很低。微博、博客、新闻网站和一些论坛都能直接支持。
    我自己搞之前最大的问题不是技术实现的问题,主要是国内广告代码乱插,导致原数据集raw data的噪音过大,数据清理起来非常麻烦。
     
  12. 爬网页这种活儿,外包出去就好了,犯不着自个儿耗神
     
  13. Big data does not need big machines,it needs big intelligence. :)
     
  14. True. A smart head beats all the above hardware combined.

    Big Data is a puff for the most with not too big brain. :D
     
  15. For real "big data" stuff, even big intelligence can't resist the temptation to use big machines :)
     
  16. 一些可以算此类应用的报道和实例吧,只是简单收集的一些最近发生的新闻事件.

    汤森路透承认提前泄露ISM数据 称并非故意
    http://wallstreetcn.com/node/25493

    用社交媒体提高投资回报率
    http://www.ftchinese.com/story/001050173

    研究:谷歌关键词可预测股市走向
    http://www.ftchinese.com/story/001050158

    大数据中的金融市场监管
    http://www.ftchinese.com/story/001050559

    50 Ideas:社交媒体
    http://www.ftchinese.com/story/001051443

    美国调查金融数据商提前发布数据
    http://www.ftchinese.com/story/001051323
     
  17. 技术手段上属于现在“热门技术”,但还是来源于“传统”。从基础逻辑来说并不新,在“传统”上有类似的应用的(当然在技术手段上“传统”的不象你说的现在技术手段那么“先进”),你谈到的好像主要是涉及高频的“舆情”相关的分析、应用,这些在“传统”上有类似的(比如交易所人工喊价时代的人声鼎沸“程度”等),个人觉得“舆情”等更偏向影响“波动率”、“易变性”,“易变性”(——包括波动性(率)、上涨下跌趋势强化、剧烈震荡等),但从“舆情”无法简单判断行情的发展,但至少会影响“波动性”从而导致“易变性”,然后结合其他“证据”从而有利于判断,也有利于风险控制。在国内可能获得“舆情”数据的能力会有些困难,但也可能可以通过一些类“传统”的数据来补充,比如“券商”委托数据流,......如果有按股票名分类的委托数量信息会更好,这些都是属于“传统”的“舆情”数据),这些“舆情”数据都是可以用来构建“热度”指标。
     
  18. gtm

    gtm

    干货好呀。虽然搞不懂。大数据是方向,会颠覆很多常识性的经验判断,更精准,更稳定
     
  19. 那是六七年前的事儿了,刚开始用的是商业化的模块和外包api开发,后来是平台本身就带,爬虫不是高级技术,有硬件投入就行,爬虫的关键是信息获取的延时问题。:)