The influence of social media on stock volatility

Xianjiao WU, Xiaolin WANG, Shudong MA, Qiang YE

PDF(1692 KB)
PDF(1692 KB)
Front. Eng ›› 2017, Vol. 4 ›› Issue (2) : 201-211. DOI: 10.15302/J-FEM-2017018

The influence of social media on stock volatility

Author information +
History +


This study explores the influence of social media on stock volatility and builds a feature model with an intelligence algorithm using social media data from in China, Sina Finance and Economics, Sina Microblog, and Oriental Fortune. We find that the effect of social factors, such as increased attention to a stock’s volatility, is more significant than public sentiment. A prediction model is introduced based on social factors and public sentiment to predict stock volatility. Our findings indicate that the influence of social media data on the next day’s volatility is more significant but declines over time.


stock volatility / social data / sentiment analysis / boosting algorithm

Cite this article

Download citation ▾
Xianjiao WU, Xiaolin WANG, Shudong MA, Qiang YE. The influence of social media on stock volatility. Front. Eng, 2017, 4(2): 201‒211


Antweiler W, Frank M Z (2004). Is all that talk just noise? The information content of Internet stock message boards. Journal of Finance, 59(3): 1259–1294
CrossRef Google scholar
Asur S, Huberman B A (2010). Predicting the future with social media. 2010 IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology (WI-IAT). IEEE, 1: 492–499
Bollen J, Mao H, Zeng X (2016). Twitter mood predicts the stock market. Eprint Arxiv, 2(1): 1–8
Chen Y (2016). Predicting stock trading volume through social media data. 2016-04-01,
Cheng W Y, Lin J (2013). The relationship between stock index and investor sentiment in social media. Management Science, 26(5): 111–119
Choi J J, Laibson D, Metrick A (2000). Does the Internet increase trading? Evidence from investor behavior in 401(k) plans. Ssrn Electronic Journal, 64(12): 10–11
Choudhury M D, Sundaram H, John A, Seligmann D D (2008). Can blog communication dynamics be correlated with stock market activity? Hypertext 2008, Proceedings of the ACM Conference on Hypertext and Hypermedia, Pittsburgh, PA, USA, 55–60
Das S R, Chen M Y (2007). Yahoo! for Amazon: sentiment extraction from  small  talk  on  the  web.  Management  Science,  53(9):  1375–1388
CrossRef Google scholar
Fang L, Peress J (2008). Media coverage and the cross-section of stock returns. Social Science Electronic Publishing, 64(5): 2023–2052
Feng L N (2013). A Study on Influence of Open Source Information Flow on Stock Volatility. Dissertation for Master’s Degree. Tianjin: Tianjin University
Freedman S, Jin G Z (2011). Learning by doing with asymmetric information: evidence from prosper. com.Nber Working Papers,2011: 203–212
Gao X P (2009). The infectivity of emotion in social network. Pictorial of Science, (9): 20–22
Geurts P, Ernst D, Wehenkel L (2006). Extremely randomized trees. Machine Learning, 63(1): 3–42
CrossRef Google scholar
He W, Guo L, Shen J, Akula V (2016). Social media-based forecasting: a case study of tweets and stock prices in the financial services industry. Journal of Organizational and End User Computing, 28(2): 74–91
CrossRef Google scholar
Li Y L, Li S C, Yang G H (2007). The correlation between stock market volume and price. Journal of Hebei University of Economy and Trade, 28(2): 65–70
Liu Y, Lv B F, Peng G (2011). Predictive power of internet search data for stock market: a theoretical analysis and empirical test. Economic Management, 33(1): 172–180
Oliveira N, Cortez P, Areal N (2017). The impact of microblogging data for stock market prediction: using Twitter to predict returns, volatility, trading volume and survey sentiment indices. Expert Systems with Applications, 73: 125–144
CrossRef Google scholar
Pak A, Paroubek P (2010). Twitter as a corpus for sentiment analysis and opinion mining. In: Proceedings of the International Conference on Language Resources and Evaluation. Valletta, Malta
Pang L, Li S S, Zhang H (2012). Research on stock investor sentiment tendency based on microblog. Computer Science, B06: 249–252
Salton G, Mcgill M J (1983). Introduction to modern information retrieval. Library Management, 32(4/5): 373–374
CrossRef Google scholar
Schumaker R P, Chen H (2009a). Textual analysis of stock market prediction using breaking financial news: the AZFin text system. ACM Transactions on Information Systems, 27(2): 1–19 
CrossRef Google scholar
Schumaker R P, Chen H (2009b). A quantitative stock prediction system based on financial news. Information Processing & Management, 45(5): 571–583
CrossRef Google scholar
Shi M J (2005). An analysis of volume’s impact on stock yield. Statistics & Information Forum, 20(2): 60–62
Sivic J, Zisserman A (2009). Efficient visual search of videos cast as text retrieval. IEEE Transactions on Pattern Analysis and Machine Intelligence, 31(4): 591–606
CrossRef Pubmed Google scholar
Tetlock P C (2007). Giving content to investor sentiment: the role  of media in the stock market. Journal of Finance, 62(3): 1139–1168
CrossRef Google scholar
Tetlock P C, Saar-Tsechansky M, Macskassy S (2008). More than words: quantifying language to measure firms’ fundamentals. Journal of Finance, 63(3): 1437–1467 
CrossRef Google scholar
Tirunillai S, Tellis G J (2012). Does chatter really matter? Dynamics of user-generated content and stock performance. Marketing Science, 31(2): 198–215
CrossRef Google scholar
Tumarkin R, Whitelaw R F (2001). News or noise? Internet postings and stock prices. Prehospital and Disaster Medicine, 57(3): 41–51
Wen F H, Xiao J L, Huang C X (2014). Research on influence of investors sentiment on stock price. Journal of Management Science, 17(3): 60–69
Yang D J, Yang J, Zhan X J (2014). Feature selection algorithm based on the random forest. Journal of Jilin University: Engineering Science, 44(1): 137–141
Yang X, Lv B F, Peng G (2013). The influence of emergency on stock market: an analysis based on online searching. Practice and Knowledge of Mathematics, 43(23): 17–28
Zou K H, O’Malley A J, Mauri L (2007). Receiver-operating characteristic analysis for evaluating diagnostic tests and predictive models. Circulation, 115(5): 654–657
CrossRef Pubmed Google scholar


The author appreciates the comprehensive assistance of Mr. Shudong MA with data gathering and compilation that led to the drafting of this article. This research is supported by National Natural Science Foundation of China (Grant No. 71532004).


2017 The Author(s) 2017. Published by Higher Education Press. This is an open access article under the CC BY license (
AI Summary AI Mindmap
PDF(1692 KB)




