本课程宗旨是了解如何使用 Spark、Pyspark AWS、Spark 应用程序、Spark EcoSystem、Hadoop 和掌握 PySpark.
您将学到:
● 大数据的引入和重要性。
● 用PySpark进行实际解释和实时编码。
● Spark应用程序
● Spark生态系统
● Spark架构
● Hadoop生态系统
● Hadoop体系结构
● Pypark RDDs公司
● PySpark RDD转换
● Pypark RDD操作
● Pypark数据帧
● Pypark数据帧转换
● Pypark数据帧操作
● PySpark中的协同过滤
● Spark流
● ETL流水线
● CDC and Replication on Going
要求
有Python方面的知识。
● 对编程有初步的了解。
● 愿意学习和实践。
MP4 | Video: h264, 1280×720 | Audio: AAC, 44.1 KHz, 2 Ch
Genre: eLearning | Language: English + srt | Duration: 151 lectures (16h 14m) | Size: 4.91 GB
Learn how to use Spark, Pyspark AWS, Spark applications, Spark EcoSystem, Hadoop and Mastering PySpark
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。