ABSTRAK
Makalah berikut mengulas pemodelan topik probabilistik, bidang yang sedang berkembang dalam pembelajaran mesin, yang telah kami pilih untuk diterapkan pada humaniora digital. Setelah memberikan beberapa informasi kontekstual mengenai mengapa pemodelan topik penting di era kita yang semakin digital, kami mengeksplorasi secara mendalam Alokasi Dirichlet Laten (LDA). Kami kemudian beralih ke pengambilan sampel Gibbs, bagian dari Rantai Markov Monte Carlo, yang menyediakan metode pengambilan sampel yang memungkinkan seseorang untuk memperkirakan variabel yang diminati dalam model LDA mereka. Sementara makalah ini meneliti bidang penelitian yang ada, makalah ini unik dalam derivasi menyeluruh dari persamaan sampler Gibbs yang diciutkan, memberikan notasi yang konsisten dan alasan di balik setiap langkah. Semua derivasi ini memberikan latar belakang yang diperlukan untuk memahami bagian-bagian pada hasil pemodelan topik kami tentang The New York Times . Pemodelan topik artikel halaman depannya dari 1 Januari 1939 hingga 31 Desember 1945 memberikan pendekatan kuantitatif untuk memahami periode Perang Dunia II.
Abstrak Grafis