تأثیر احساسات عمومی بر پیش بینی جنبش بورس سهام در هنگام شیوع COVID-19

ساخت وبلاگ

این مقاله از طریق زیر مجموعه دسترسی باز PMC برای استفاده مجدد از تحقیقات نامحدود و تجزیه و تحلیل ثانویه به هر شکلی یا به هر وسیله با تأیید منبع اصلی در دسترس است. این مجوزها برای مدت زمان اعلام سازمان بهداشت جهانی (WHO) COVID-19 به عنوان یک بیماری همه گیر جهانی اعطا می شود.

داده های مرتبط

مجموعه داده های تولید شده در طول و/یا تجزیه و تحلیل در طول مطالعه حاضر از نویسنده مربوطه در صورت درخواست معقول در دسترس است.

خلاصه

پیش بینی بازار سهام یکی از دشوارترین تعهدات در صنعت مالی به دلیل شخصیت پیچیده ، بی ثبات ، پر سر و صدا و غیر پارامتری است. با این حال ، با پیشرفت علوم رایانه ، یک مدل هوشمند می تواند به سرمایه گذاران و تحلیلگران کمک کند تا ریسک سرمایه گذاری را به حداقل برسانند. افکار عمومی در مورد رسانه های اجتماعی و سایر درگاه های آنلاین عامل مهمی در پیش بینی بازار سهام است. همه گیر Covid-19 فعالیت های آنلاین را تحریک می کند زیرا افراد مجبور به ماندن در خانه هستند و تعداد زیادی از افکار و احساسات عمومی را به همراه می آورند. این تحقیق بر پیش بینی حرکت بازار سهام با احساسات عمومی با استفاده از شبکه حافظه کوتاه مدت کوتاه (LSTM) در طول شعله ور Covid-19 متمرکز شده است. در اینجا ، هفت ابزار مختلف تجزیه و تحلیل احساسات ، Vader ، رگرسیون لجستیک ، Loughran-Mcdonald ، Henry ، TextBlob ، SVC خطی و استنفورد ، برای تجزیه و تحلیل احساسات در داده های اسکناس وب از چهار منبع آنلاین استفاده می شود: عناوین مقالات مربوط به سهام ، توییت ها ، مالیاخبار مربوط به "زمان اقتصادی" و نظرات فیس بوک. پیش بینی ها با استفاده از هر دو نمره احساس و اطلاعات معتبر سهام برای هر یک از 28 اقدامات نظر پردازش شده انجام می شود. با استفاده از SVC خطی برای محاسبه رتبه بندی احساسات از نظرات فیس بوک ، دقت 98. 11 ٪ حاصل می شود. پس از آن ، چهار امتیاز برآورد شده از هر یک از هفت ابزار با داده های سهام به صورت گام به گام یکپارچه شده اند تا تأثیر کلی در بورس سهام را تعیین کنند. هنگامی که هر چهار نمره احساسات با داده های سهام جفت می شوند ، دقت پیش بینی برای پنج از هفت ابزار در قابل توجه ترین آن است ، با نمرات محاسبه شده خطی SVC که به داده های سهام کمک می کند تا به دقت بیشتری از 98. 32 ٪ برسد.

کلمات کلیدی: خراش وب ، تجزیه و تحلیل احساسات ، پیش بینی بازار سهام ، یادگیری عمیق

معرفی

پیش بینی بازار سهام به دلیل شخصیت بسیار تصادفی ، همچنان یک کار چالش برانگیز در بخش اقتصاد است. پیش بینی و تجزیه و تحلیل حرکات بورس اوراق بهادار شهرت بزرگی را به دست آورده است ، زیرا تغییرات جنبش بورس ممکن است تأثیر عمیقی بر اقتصاد داشته باشد. عوامل سیاسی ، اجتماعی ، زیست محیطی ، اقتصادی ، اقتصادی و عمومی همگی بر جنبش بورس اوراق بهادار تأثیر دارند (چو ، پارک و چو ، 2021 ؛ شانگ و همکاران 2021) که باعث نوسان بازارها و پیچیده شدن و نامشخص می شود (چودوری ، موکرجی، Chowdhury ، Sadhukhan ، and Goswami ، 2018 ؛ Wagner 2020). نوسانات بازار سهام برای سرمایه گذاران مشهور است. آنها دائماً حرکات بازار را برای مدیریت سرمایه گذاری های خرد و به حداکثر رساندن سود در حالی که ریسک را به حداقل می رساند ، نظارت می کنند. پیش بینی حرکت بازار سهام یک کار دشوار است که نیاز به تجزیه و تحلیل داده های زیادی دارد. مدل های آماری مناسب و الگوریتم های هوشمندانه هوشمند برای رسیدگی به این موضوعات و یافتن یک راه حل کافی لازم است. الگوریتم های بیشمار یادگیری ماشین و یادگیری عمیق ممکن است پیش بینی قابل توجهی با حداقل خطاهای ایجاد کنند (Mukherjee ، Sadhukhan ، Sarkar ، Roy و De ، 2021).

حرکت بازار سهام را می توان با استفاده از تجزیه و تحلیل اساسی (که ملاحظات اقتصادی را در نظر می گیرد) یا تجزیه و تحلیل فنی (که داده های تاریخی را در نظر می گیرد) مورد مطالعه قرار داد (Valle-Cruz و همکاران 2021). نظرات سرمایه گذاران ، احساسات معامله گران ، دیدگاه های عمومی عمومی و اخبار مختلف دسته دیگری از عواملی است که بدون شک در بازار سهام تأثیر می گذارد (بیسوا و همکاران 2020). این ممکن است در مجموع به عنوان بخشی از زمینه شناخته شده تحقیقاتی که به عنوان تجزیه و تحلیل احساسات شناخته می شود طبقه بندی شود. تجزیه و تحلیل احساسات نوعی تجزیه و تحلیل است که از آمار ، پردازش زبان طبیعی و یادگیری ماشین استفاده می کند تا محتوای عاطفی ارتباطات را مشخص کند (حاجمیدا و اوسلاتی 2021 ؛ حسین 2018).

Covid-19 برای اولین بار در ژانویه سال 2020 در هند پیدا شد. این می تواند باعث یک بیماری همه گیر وحشتناک شود. از مارس 2020 ، کلیه محل های کاری ، از جمله دفاتر ، مغازه ها و بازارها ، به طور نامحدود تعطیل شده اند. تمام فعالیت های تجاری متوقف شد و در نتیجه فروپاشی اقتصادی در سراسر جهان انجام شد. به دلیل سناریوی کل قفل ، مردم مجبور به کار از خانه هستند. در این زمان سخت ، از بسترهای رسانه های اجتماعی عمیقاً برای به اشتراک گذاشتن احساسات ، عقاید در مورد مسائل اقتصادی و معضل در سرمایه گذاری در بورس استفاده می شود. نظرات و احساسات در بسیاری از سیستم عامل های رسانه های اجتماعی ارسال می شود و اخبار و مقالات مالی به چندین زبان از ایالت های مختلف هند است. پردازش زبان طبیعی در پردازش آنها کمک می کند و تجزیه و تحلیل احساسات احساسات آنها را استخراج می کند (Rajput 2020).

تجزیه و تحلیل احساسات را می توان از طریق مجموعه ای از رویکردها و ابزارها هدایت کرد. تجزیه و تحلیل احساسات در حال حاضر برای پیش بینی حرکات بازار سهام توجه زیادی را به خود جلب می کند. این مطالعه به تجزیه و تحلیل احساسات توییت ها ، نظرات فیس بوک ، عناوین خبری و مقالات خبری مالی آنلاین می پردازد. رتبه بندی احساسات ایجاد شده به این روش با داده های سهام برای بررسی پیامدهای یک همه گیر Covid-19 جفت می شود. انگیزه این اکتشاف معرفی مدلی است که در آن نمرات احساسات تولید شده توسط تکنیک های تجزیه و تحلیل احساسات متعدد با داده های بازار سهام برای تعیین کمیت و مقایسه عملکرد پیش بینی ادغام می شوند. از هفت ابزار تجزیه و تحلیل احساسات در این مقاله برای ساختن نمرات احساسات از چهار منبع مختلف داده های خراشیده وب استفاده می شود. داده های مربوط به شاخص بازار سهام Nifty-50 از Finance Yahoo برای این تحقیق بدست آمد. از داده های سهام برای استخراج ویژگی های OHLC (باز ، بالا ، کم و نزدیک) استفاده شده است.

بقیه این کار تحقیقاتی به شرح زیر سازماندهی شده است: بخش 2 در مورد آثار مربوطه انجام شده در این زمینه تحقیق بحث می کند. بخش 3 مطالعات پیش زمینه درگیر در این کار را شرح می دهد. بخش 4 مدل اصلی سیستم ارائه شده در این کار تحقیق را ارائه می دهد. بخش 5 تجزیه و تحلیل و اجرای تجربی را نشان می دهد. بخش 6 در مورد نتایج و تجزیه و تحلیل آنها بحث می کند. بخش 7 کار پیشنهادی را با آثار موجود مقایسه می کند. سرانجام ، فرقه8 دقیقاً کار را با برخی از پیشنهادات کار آینده نتیجه می گیرد.

کار مرتبط

افزایش اخیر در دسترس بودن داده های متنی باعث افزایش علاقه به تحلیل احساسات شده است. نظر کاوی و جمع بندی نظرات دو زیرشاخه اصلی تحلیل احساسات هستند. اولی اغلب با پیش بینی اینکه آیا متن بر اساس آنچه ما سعی در پیش بینی آن داریم، ارزش مثبت یا منفی را منعکس می کند، سروکار دارد، در حالی که دومی معمولاً به خلاصه کردن آنچه بیان شده است توجه دارد (درخشان و بیگی 2019). تحلیل احساسات ممکن است در سطوح مختلف انتزاع انجام شود. این بخش بر بررسی عمیق مقالات مختلف تحقیقاتی مرتبط تمرکز دارد. تمرکز اصلی در این مورد، بررسی پیش بینی حرکت بازار سهام و تحلیل احساسات داده های خراش شده وب است.

محققان متعددی نظرات فیس بوک را جمع آوری و تجزیه و تحلیل کرده اند تا از آنها در عملیات های مختلف و فرآیندهای تصمیم گیری استفاده کنند (Akter and Aziz 2016؛ Hajhmida and Oueslati 2021؛ Marengo et al. 2021؛ Rase 2020). حاجمیدا و همکارانپیشنهاد شده با استفاده از داده های فیس بوک برای پیش بینی شکست برنامه های تلفن همراه. آنها از API نمودار فیس بوک برای ارزیابی قطبیت احساسات نظرات کاربران استفاده کردند و سپس یک مدل پیش بینی شکست با استفاده از تکنیک های یادگیری ماشین ساختند (Hajhmida and Oueslati 2021). آکتر و همکارانقیمت های بازار را با استفاده از تحلیل احساسات داده های به دست آمده از پست های رسانه های اجتماعی FOODBANK، که یک گروه بسیار محبوب فیس بوک در بنگلادش است، با استفاده از رویکرد واژگان تعیین کرد (Akter and Aziz 2016). مارنگو و همکاراناز یک رویکرد مدلسازی زبان برای کشف ارتباط بین زبان بیان شده در فیس بوک و کیفیت زندگی خود گزارش شده (فیزیکی، روانی، اجتماعی) استفاده کرد (مارنگو و همکاران 2021). فن آوری های یادگیری عمیق مانند شبکه های عصبی کانولوشن و حافظه کوتاه مدت برای درک احساسات و نظرات افراد با تولید تحلیل احساسات اطلاعات سایت شبکه اجتماعی افعان ارومو مانند پست ها و نظرات فیس بوک (Rase 2020) مورد استفاده قرار گرفته اند.

تجزیه و تحلیل احساسات توییتر همچنین ما را قادر می سازد تا تصمیمات بی شماری بگیریم. آنها از یک مدل LSTM استفاده کردند که شامل احساسات سرمایه گذار ، داده های سری قیمت سهام و مکانیسم توجه برای ارائه پیش بینی دقیق قیمت سهام (چو و همکاران 2021). احساسات سرمایه گذاران مورد توجه قرار می گیرند و توییت های سرمایه گذاران با استفاده از شاخص احساسات جمع آوری و مرتب می شوند تا تعیین کنند که آیا سرمایه گذار قصد خرید یا فروش دارد. حسن و همکاران. تجزیه و تحلیل احساسات بیان شده در توییت در مورد نشریات تحقیقاتی جدید برای ارزیابی میزان تأثیرگذار آنها در چرخه تحقیق. طبق یافته ها ، نشان داده شده است که ارتباط مثبت بین احساسات توییت و تعداد استناد به پیش بینی تأثیر اولیه ادبیات مفید است (O. A.-H. Hassan ، Ramaswamy و Miller ، 2009). لو و همکاران. تجزیه و تحلیل احساسات را در مجموعه داده های بزرگی از توییت های مربوط به گردشگری کروز در طول همه گیر Covid-19 انجام داد.

این مطالعه اهمیت تجزیه و تحلیل احساسات را برجسته می کند و مجدداً درخواست اخیر برای تجزیه و تحلیل احساسات را تأیید می کند تا یک مؤلفه مهم تحقیقات گردشگری باشد (لو و ژنگ 2021). احساسات عمومی ممکن است با رفتار قیمت سهام مرتبط باشد. Kordonis و همکاران. تکنیک های یادگیری ماشین استفاده شده برای تعیین همبستگی بین توییت ها و رفتار قیمت بازار سهام (Kordonis ، Symeonidis و Arampatzis ، 2016). پیش بینی نتایج انتخابات همچنین از تجزیه و تحلیل احساسات استفاده می کند ، که افکار عمومی در رسانه های اجتماعی را تجزیه و تحلیل می کند تا پیش بینی های دقیقی در مورد چگونگی پشتیبانی از رای دهندگان انجام دهد (Chauhan et al. 2021).

مقالات و عناوین روزنامه ها منبع دیگری از متن برای تجزیه و تحلیل احساسات هستند. غاسیا و همکاران. از تکنیک مدل سازی موضوع ماتریس غیر منفی (NMF) در مقالات مربوط به خاورمیانه از سه روزنامه ژاپنی استفاده کرد. آنها پس از شناسایی مضامین بحرانی ، آنها از تکنیک های معمولی یادگیری ماشین استفاده کردند تا احساسات کلی و موضوع خاص را از عناوین اکتسابی استخراج کنند (Ghasiya و Okamura 2021). احساسات کاربران به دست آمده از عناوین خبری تأثیر بسزایی در خرید و فروش معامله گران دارند ، زیرا آنها به سرعت تحت تأثیر آنچه می خوانند تحت تأثیر قرار می گیرند. گیت و همکاران. از یادگیری عمیق مبتنی بر LSTM در رابطه با تکنیک های یادگیری ماشین برای پیش بینی قیمت سهام با درجه بالایی از دقت استفاده شده است (گیت و همکاران 2021). مهتا و همکاران. تکنیکی را برای پیش بینی صحت قیمت سهام که علاوه بر سایر خصوصیات ، افکار عمومی را نیز در نظر می گیرد ، توسعه داده و مستقر کرد. برای برآورد قیمت سهام آینده ، الگوریتم پیشنهادی احساسات عمومی ، نظرات ، اخبار و قیمت سهام گذشته را در نظر می گیرد (مهتا و همکاران 2021).

اخبار مالی آنلاین و سایر مقالات خبری ابزارهای مهم برای تصمیم گیری های بسیاری هستند که ممکن است از طریق تجزیه و تحلیل احساسات در انواع زمینه های تحقیقاتی مورد استفاده قرار گیرد. یک سیستم تجزیه و تحلیل احساسات جدید مبتنی بر یک شبکه عصبی عمیق در (شی و همکاران 2021) توسعه یافته است. تکنیک جدید طبقه بندی احساسات را 9 ٪ در مقایسه با روش رگرسیون لجستیک بهبود بخشید. علاوه بر این ، اطلاعات احساسات محاسبه شده توسط سیستم تجزیه و تحلیل به کار پیش بینی حرکت سهام و عملکرد قابل توجهی در مقایسه با تکنیک هایی که از داده های صرفاً تجارت به عنوان ورودی استفاده می کردند ، به طور قابل توجهی افزایش یافته است. لی و نگوین با هدف کاهش یک چارچوب انقلابی که از تجزیه و تحلیل احساسات برای پیش بینی سه ، پنج ، ده ، بیست و سی روز حرکت قیمت IPO با ارزیابی دفترچه خود استفاده می کند ، ریسک سرمایه گذار را کاهش می دهد. وو و همکاران. شاخص احساسات سرمایه گذاران را با استفاده از یک رویکرد تجزیه و تحلیل احساسات بر اساس شبکه های عصبی حلقوی با استفاده از داده های غیر سنتی محاسبه کرد. آنها شاخص احساسات ، شاخص های فنی و داده های معاملات سهام تاریخی را به عنوان ویژگی پیش بینی قیمت سهام مجموعه و از یک شبکه حافظه کوتاه مدت بلند مدت برای پیش بینی بازار سهام A Changhai A Changhai استفاده کردند (وو و همکاران 2021). محققان هنگام پیش بینی روند قیمت روزانه شاخص بازار سهام OMXS30 ، دریافتند که اضافه کردن ویژگی های احساسات استخراج شده از اخبار مالی به یک مجموعه داده عددی بر اساس قیمت های گذشته عملکرد طبقه بندی را بهبود می بخشد (النا 2021). Arif et al. عملکرد سیستم های طبقه بندی کننده یادگیری (LCSS) ، که رویکردهای یادگیری ماشین مبتنی بر قانون هستند ، در تجزیه و تحلیل احساسات توییت ها و بررسی های فیلم و همچنین شناسایی هرزنامه با استفاده از پیامک و مجموعه داده های ایمیل بررسی شده است.(Arif et al. 2018). رویکرد LCS موجود با درج یک طرح رمزگذاری منحصر به فرد برای قوانین طبقه بندی کننده گسترش می یابد تا از کمبود وکتور ویژگی استفاده کند. یافته های جمع آوری شده نشان می دهد که استراتژی رمزگذاری پیشنهادی روند یادگیری را تسریع می کند و به طور مداوم نتایج با کیفیت بالا را در تمام مطالعات ایجاد می کند. ترنر و همکاران. تأکید بر پیش بینی قیمت سهام با استفاده از واژگان احساساتی ساخته شده از سوابق تماس کنفرانس مالی. آنها تکنیکی را برای تولید خودکار واژگان احساسات بر اساس یک روش احتمالی تعیین شده فراهم کردند. این تحقیق همچنین نشان می دهد که هنگام پیش بینی تغییر قیمت سهام ، واژگان احساسات خاص دامنه از واژگان عمومی احساسات خارج می شود (ترنر ،

Labille، علوم کامپیوتر و مهندسی کامپیوتر، دانشگاه آرکانزاس، فایت ویل، آرکانزاس، ایالات متحده، Gauch، و علوم کامپیوتر و مهندسی کامپیوتر، دانشگاه آرکانزاس، فایت ویل، آرکانزاس، ایالات متحده، 2021). هوانگ و تاناکا یک سیستم یادگیری تقویتی چندعاملی مدولار شده را با هدف معرفی مقیاس پذیری، قابلیت استفاده مجدد و عمق دریافت اطلاعات در مدیریت سبد مالی با استفاده از داده های احساسات اخبار وب طراحی کردند (Z. Huang and Tanaka 2021). آنها نشان دادند که تکنیک آنها به دلیل اصالت و برتری آن نسبت به معیارهای فعلی، به عنوان یک پله برای الهام بخشیدن به طرح های نوآورانه سیستم مدیریت پورتفولیوی مالی واجد شرایط است. مطالعه اخیر دیگری با هدف پیش بینی حرکت نامنظم قیمت ارزهای دیجیتال با مطالعه احساسات رسانه های اجتماعی و تعیین ارتباط آنها انجام شده است (X. Huang et al. 2021). این تحقیق روشی را برای تعیین احساسات پیام ها در محبوب ترین شبکه رسانه های اجتماعی چین، Sina Weibo ارائه کرد. در این تحقیق، پست های Weibo ضبط شد، واژگان احساسات خاص رمزنگاری ایجاد شد، و یک شبکه عصبی بازگشتی مبتنی بر حافظه کوتاه مدت (LSTM) برای پیش بینی روند قیمت برای بازه های زمانی آینده با استفاده از حرکت قیمت ارزهای دیجیتال گذشته استفاده شد.. جدول 1 جدول 1 خلاصه مختصری از کارهای مرتبط در این حوزه را نشان می دهد.

میز 1

خلاصه کارهای مرتبط کار مرتبط کار مرتبط اطلاعات منبع اطلاعات ابزارهای تحلیل احساسات (SA) و سایر الگوریتم های کاری
نتیجه فیس بوک (حجهمیدا و اوسلاتی 2021) خزیدن وب apptracs. com. نظرات، تعداد اشتراک گذاری ها، لایک ها و سایر اطلاعات مرتبط ذخیره شده در MongoDB واژگان کلمات ایجاد شده توسط کاربر، نزدیکترین همسایگان، RBF SVM، درخت تصمیم، جنگل تصادفی، شبکه های عصبی، AdaBoost، Naïve Bayes، رگرسیون لجستیک
قطبیت بسیار مثبت، مثبت، بسیار منفی و منفی. بهترین دقت پیش بینی 84. 73 درصد از جنگل تصادفی (Akter and Aziz 2016) گروه فیس بوک مستقر در بنگلادش "FOODBANK" مبتنی بر فرهنگ لغت؛مبتنی بر فرهنگ لغت، بیز ساده لوح
دقت مبتنی بر فرهنگ لغت 73٪، تجزیه و تحلیل مبتنی بر واژگان بهتر از Naïve Bayes است (مارنگو و همکاران 2021) 603 زبان تولید شده توسط کاربر داده کاوی از طریق روش واژگان بسته LIWC با استفاده از جنگل های تصادفی برای پیش بینی ابعاد کیفیت زندگی
بالاترین دقت در ابعاد روانشناختی و کیفیت زندگی عمومی به دست آمده است (Rase 2020) 1452 نظر سایت رسمی حزب دموکراتیک اورومو احساسات در سطح سند توسط چندجمله ای Naïve Bayes، LSTM و CNN
اگرچه MNB از LSTM (دقت 87. 6 درصد) و CNN (دقت 89 درصد) بهتر عمل می کند، اما با مشکلات نظرات غیرمستقیم مواجه است. توییتر (چو و همکاران 2021) Stock Twits و Twitter برای SA، Yahoo Finance برای داده های سهام LSTM و GloVec
LSTM + امتیاز احساسات + توجه مدل بهتر عمل می کند (S.-U. Hassan et al. 2020) توییت هایی برای SA و Altmetric. com برای انتشارات SentiStrength، رگرسیون خطی با یک نشانگر اضافی: "تعداد کاربران منحصر به فرد توییتر"
همبستگی مثبت بین توییت ها و تأثیر اولیه ادبیات (لو و ژنگ 2021) توییت ها مدل LDA، واگرایی Kullback-Leibler (KL).
اشتیاق برای سفرهای دریایی خاص به جای سفرهای انبوه (مهتا و همکاران 2021) Apache Flume برای توییت های بیت کوین، مقالات خبری استفاده می شود XGBoost، LSTM
احساسات مثبت نسبت به پیش بینی ارز دیجیتال (سینگ و همکاران 2021) API های tweepy از 20 ژانویه 2020 تا 25 آوریل 2020 برای داده های توییت جهانی و توییت های هند ابزار BERT برای طبقه بندی، VADER برای شدت، و TextBlob برای قطبیت و ذهنیت
هندی ها با دولت ارتباط مثبت برقرار کردند. فعالیت با دقت 94 درصد [18] 100000 توییت با استفاده از مدت زمان API 19/10/2020 29/10/2020 TextBlob Rule Based، LDA، SARIMAX
دقت 76%، RMSE 0. 196 (لو و ژنگ 2021) توییت ها یادگیری ماشینی، یادگیری مبتنی بر واژگان و یادگیری عمیق
استفاده از روش های یادگیری ماشین در پیش بینی نتایج انتخابات غالب بود روزنامه خبری (قاسیا و اوکامورا 2021) تیتر سه روزنامه ژاپنی رویکرد مدل سازی موضوع الگوریتم های NMF، NLP و ML
50. 37 درصد نتیجه منفی و 49. 63 درصد مثبت است (گیت و همکاران 2021) "The Pulse" برای SA و یاهو مالی برای داده های سهام LSTM-CNN برای SA و LSTM برای پیش بینی قیمت سهام
اشتیاق برای سفرهای دریایی خاص به جای سفرهای انبوه (مهتا و همکاران 2021) BSE Sensex-Infosys برای داده های سهام و کنترل پول، IIFL، Economic Times، Business Standard، رویترز، و Live Mintdata برای SA ماشین بردار پشتیبان، طبقه بندی کننده MNB، رگرسیون خطی، بیز ساده و حافظه بلند مدت کوتاه مدت
LSTM با دقت 92. 45 درصد بهتر عمل می کند اخبار مالی آنلاین و سایر مقالات خبری (شی و همکاران 2021) انجمن آنلاین مالی Snowball در چین برای جمع آوری نظرات مالی سرمایه گذاران برای SA، صرافی های شانگهای، 50 سهام برتر در صرافی های شنژن و 30 سهام برتر در سهام آمریکا CNN، GRU برای SA. SVM، LR برای پیش بینی سهام
9٪ بهبود نسبت به LR برای SA، پیش بینی سهام 1. 25٪ نسبت به LR بهبود یافته است (Ly and Nguyen 2020) پنج مجموعه داده مختلف: قیمت 3، 5، 10، 20 و 30 روز اول بسته Edgar و لیست کلمات Sentiment Loughra n-Mcdonald برای SA ، مدل پایه ، جنگل های تصادفی ، درخت تصمیم ، خلیج های ساده و رگرسیون لجستیک برای پیش بینی حرکت قیمت
رگرسیون لجستیک بهترین عملکرد را انجام می دهد ، سپس Bayes ساده و مدل پایه می آید (وو و همکاران 2021) پست های سهام و اخبار مالی برای SA و داده های بازار سهام A Changhai A Changhai CNN برای SA و LSTM برای پیش بینی قیمت بسته شدن سهام
دقت بسیار نزدیک به قیمت واقعی است (النا 2021) داده های سهام OMXS30 و اخبار مالی برای SA Vader ، Loughran-McDonald برای SA و یک مدل گروه مبتنی بر درخت: XGBOOST برای پیش بینی حرکت قیمت سهام
یک پارامتر Hyper با استفاده از اعتبار سنجی متقابل و جستجوی شبکه برای عملکرد بهتر استخراج می شود (Arif et al. 2018) داده های وب و مجموعه داده های Kaggle Naïve Bayes ، RCNN و Forest Random
Kaggle DataSet از 96. 13 ٪ بیش از 86. 5 ٪ از داده های پیچیده وب بهتر است. Bayes Naïve حداقل کارآمد و RCNN را به طور کارآمد انجام می دهد (ترنر و همکاران 2021) داده های سهام و داده های وب با واژگان خاص دامنه واژگان هنری ، واژگان Loughran و Sentiwordnet
واژگان خاص دامنه دقیق ترین است (Z. Huang and Tanaka 2021) قیمت های تاریخی از بازار سهام ایالات متحده و اخبار مربوط به دارایی از رسانه ها شبکه Q Deep
سام با قابلیت EAM بهترین عملکرد را داشت (X. هوانگ و همکاران 2021) پست های رسانه های اجتماعی Weibo برای SA و قیمت ارز رمزنگاری LSTM

LSTM با دقت 18. 5 ٪ و در فراخوان 15. 4 ٪ بهتر از رویکرد AR است

براساس مطالعه بررسی ، تحقیقات قابل توجهی قبلاً در مورد تجزیه و تحلیل احساسات در پیش بینی حرکت بورس با استفاده از داده های صفحه ای از منابع مختلف مانند توییتر ، فیس بوک و عناوین خبری انجام شده است. با این حال ، برای برآورد صحیح تأثیر احساسات عمومی بر حرکت بازار سهام ، کار اضافی قابل توجهی لازم است.

روش شناسی

این بخش دقیقاً مفاهیم نظری اصلی مورد استفاده در تلاش تحقیق حاضر را پوشش می دهد. تحلیل احساسات رویکرد شناخته شده علم داده است. تقریباً هر حوزه تحقیقاتی فعال از رویکردهای علم داده در حوزه های مربوطه خود استفاده می کند، زیرا بسیاری از الگوریتم ها، نظریه های یادگیری ماشین و ابزارها را برای کشف دانش مدفون از داده های خام گرد هم می آورد (Budiharto 2021). در حال حاضر، پیش بینی و تحلیل حرکت بازار سهام یکی از محبوب ترین حوزه هایی است که علم داده در آن به طور گسترده مورد استفاده قرار می گیرد. حرکت قیمت های بازار تحت تأثیر عوامل مختلف آنلاین از جمله نظرات رسانه های اجتماعی، اخبار مالی، اخبار مرتبط با سهام و بسیاری موارد دیگر قرار دارد. پردازش زبان طبیعی روشی برای مقابله با این نوع داده های آنلاین بدون ساختار با تبدیل آن ها به قالبی ساختاریافته است که رایانه می تواند با داده های موجودی ترکیب کند تا تأثیر آن ها را بر پیش بینی بازار تعیین کند (بیسواس و همکاران 2020؛ حاجمیدا و اوئسلاتی 2021؛ حسین. 2018).

پردازش زبان طبیعی، تجزیه و تحلیل احساسات، و خراش دادن وب

پردازش زبان طبیعی (NLP) زیر شاخه ای از هوش مصنوعی (AI) است که داده های متنی را برای کشف دانش زیربنایی تجزیه و تحلیل می کند (Okon et al. 2020). نوسانات بازار سهام ممکن است تأثیر اقتصادی قابل توجهی بر اقتصاد و مشتریان فردی داشته باشد. از سوی دیگر، رویدادهای عمومی، تورم و رسانه های خبری همگی بر حرکت قیمت سهام تأثیر دارند (شی و همکاران 2021). تحلیل احساسات یک تکنیک طبقه بندی است که به داده های عمومی برای نظرکاوی می پردازد. از تکنیک های پردازش زبان طبیعی برای تعیین قطبیت یک عقیده، عاطفه یا احساس بر حسب احساسات مثبت، منفی یا خنثی استفاده می کند (النا 2021). داده های وب در زمینه های مختلفی از جمله تحقیق، دانشگاه، تجارت، بازاریابی و حاکمیت ضروری هستند. این داده ها در قالب های مختلف در دسترس هستند. دانلود دستی داده های وب یک کار خسته کننده است. Web scraping یک فناوری استخراج داده است که به عنوان یک برنامه نرم افزاری ارائه می شود که به طور خودکار داده ها را از وب سایت های مختلف استخراج می کند و آنها را در یک نوع رایج پایگاه داده ذخیره می کند و امکان پردازش، تجزیه و تحلیل و تجسم داده ها را آسان تر می کند (De S Sirisuriya، 2015؛ Patel 2020)..

ابزارهای تحلیل احساسات

An exteal file that holds a picture, illustration, etc. Object name is 13278_2022_919_Fig1_HTML.jpg

هر یک از هفت ابزار تجزیه و تحلیل احساسات مورد استفاده در این کار در زیر نشان داده شده است. مکان این ابزارها در طبقه بندی تجزیه و تحلیل احساسات در شکل 1 نشان داده شده است. اگرچه رگرسیون لجستیک (LR) به عنوان رگرسیون یادگیری تحت نظارت طبقه بندی می شود ، اما طبقه بندی باینری را انجام می دهد. در نتیجه ، رگرسیون لجستیک و طبقه بندی کننده های بردار پشتیبانی دو تکنیک طبقه بندی گسترده است. رگرسیون لجستیک یک تکنیک آماری است که از یک مجموعه داده خطی برای پیش بینی مقادیر باینری برای هر تعداد متغیرهای مستقل استفاده می کند (Ly و Nguyen 2020). از طرف دیگر ، SVC برای کشف حداکثر جداسازی داده ها در طول طبقه بندی ، یک هیپرپلن جداکننده بهینه ایجاد می کند (مهتا و همکاران 2021).

موقعیتهای تجزیه و تحلیل احساسات (در این کار استفاده می شود) در طبقه بندی تجزیه و تحلیل احساسات

NLTK (کیت ابزار زبان طبیعی) یک پلتفرم برتر پردازش زبان طبیعی منبع باز (NLP) برای پایتون است که دارای بیش از 50 شرکت است. Sentiwordnet یک منبع منبع واژگان و پردازش متن برای طبقه بندی ، نشانه گذاری و استدلال معنایی است. TextBlob یک کتابخانه پایتون است که از شرکت NLTK استفاده می کند تا نمرات قطبیت و ذهنیت را پس از پردازش به داده های متن اختصاص دهد (Bonta et al. 2019). فرهنگ لغت آگاهانه Valence برای استدلال احساسات ، Vader مختصر ، یک ابزار تجزیه و تحلیل احساسات آزاد و مبتنی بر قانون مبتنی بر قانون است که قطبیت (مثبت ، منفی ، خنثی) و همچنین میزان کلمه ارزش قطبیت را بر اساس کلمه طبقه بندی می کند (سینگ و همکاران 2021). این کار با داده های رسانه های اجتماعی بهتر کار می کند و از تابع polarity_scores () برای محاسبه قطبیت کلمات استفاده می کند (بنتا و همکاران 2019). ابزار Loughran-Mcdonald مجهز به یک فرهنگ لغت احساساتی با شش ابعاد احساساتی بر اساس صنعت مالی ، مناسب ترین طبقه بندی متن مالی است (النا 2021). طبقه بندی قطبیت مثبت ، منفی و خنثی با استفاده از این فرهنگ لغت ساخته شده دستی ایجاد می شود. اگر C-1 و C-2 تعداد کلمات مثبت و منفی را نشان می دهد ، به ترتیب ، از C-1/جمله و جمله C-2/جمله برای بیان قطبیت جمله به عنوان مثبت (1) یا منفی (-1) استفاده می شود (ترنرو همکاران 2021). هنری یکی دیگر از آنالایزر های احساساتی مبتنی بر فرهنگ لغت است. مانند Loughra n-Mcdonald ، این ابزار بر کلمات مثبت و منفی مرتبط با امور مالی متمرکز است. از عملکرد LoadDociationhe () برای دسترسی به کلمات در طی این فرآیند تجزیه و تحلیل استفاده می شود (ترنر و همکاران 2021). استنفورد Corenlp ابزاری برای تجزیه و تحلیل احساسات است که مبتنی بر یک شبکه عصبی بازگشتی است. با بررسی معنای متن ، نمره احساسات را به عنوان قطب محاسبه می کند (لین و همکاران 2018).

حافظه کوتاه مدت طولانی (LSTM)

ویدیو های آموزشی فارکس...
ما را در سایت ویدیو های آموزشی فارکس دنبال می کنید

برچسب : نویسنده : محبوب امانی بازدید : 36 تاريخ : چهارشنبه 18 مرداد 1402 ساعت: 19:12