Movie Data Analysis & Visualization

This project provides a comprehensive analysis of global movie data, focusing on production trends, genre statistics, regional differences, director and actor influence, and user rating behaviors. The analysis is performed using Apache Spark (Scala) for large-scale data processing and Python (Jupyter Notebook) for visualization.

Features

Production Trend Analysis: Explore the yearly trend of movie releases from 1873 to 2019.
Genre Analysis: Statistical analysis of movie genres, including rating distribution, popularity, and market share.
Regional Analysis: Compare movie ratings and production across different regions and analyze regional collaboration effects.
Director & Actor Analysis: Evaluate the influence of directors and actors based on average ratings, productivity, and collaboration.
User Rating Behavior: Analyze user activity, rating preferences, and consistency.
Data Visualization: Interactive charts and visual reports using Python and pyecharts.

Directory Structure

data/ : Raw data, Scala analysis scripts, and output CSVs.
visiual.ipynb : Jupyter Notebook for data visualization and further analysis.
图表/ : Saved charts and visualizations.
16region_rating_analysis.html : Example HTML visualization output.

How to Use

Data Preparation: Place raw movie and rating data in the data/ directory.
Run Analysis: Use the Scala scripts in data/ with Apache Spark to generate analysis results (CSV files).
Visualization: Open visiual.ipynb in Jupyter Notebook to visualize and further analyze the results.
View Charts: Check the 图表/ directory and HTML files for exported visualizations.

Requirements

Apache Spark
Scala
Python 3.x
Jupyter Notebook
pyecharts, pandas

License

This project is for academic and research purposes.

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
.idea		.idea
data		data
图表		图表
16region_rating_analysis.html		16region_rating_analysis.html
README.md		README.md
visiual.ipynb		visiual.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Movie Data Analysis & Visualization

Features

Directory Structure

How to Use

Requirements

License

About

Uh oh!

Releases

Packages

Languages

StarryCode-Lang/Movie-Analytics-with-Spark-Python

Folders and files

Latest commit

History

Repository files navigation

Movie Data Analysis & Visualization

Features

Directory Structure

How to Use

Requirements

License

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages