E-MapReduce技术解决方案_最佳实践列表页

按标签筛选(可多选)

  • 全部
  • 前端Web和移动应用程序开发
  • 网站搭建
  • 网络组网
  • 数据库
  • 迁云
  • 云上运维
  • 微服务
  • 中间件
  • 容器与K8S
  • Serverless
  • 计算视觉
  • 语音处理
  • 自然语言处理
  • 机器学习
  • 数据分析
  • HPC
  • 安全&合规
  • 容灾&备份
  • CDN&视频云
  • 安全办公
  • 专有云
  • 物联网
产品
难易程度

请选择

  • 初级
  • 中级
  • 高级
  • 专家
排序方式

按浏览量排序

  • 发布时间正序
  • 发布时间倒序
  • 按浏览量排序
数据分析

SLS多云日志采集、处理及分析

多云平台服务器上采集日志写入到阿里云日志服务/帮助提升运维、运营效率

9956
数据分析

EMR弹性数据湖分析

利用阿里云日志服务、存储服务以及EMR构建弹性低成本大数据日志离线分析系统

数据分析
|
迁云

自建Hadoop迁移到阿里云EMR

介绍如何将客户自建Hadoop集群的文件系统(HDFS)数据迁移到阿里云EMR集群。

数据分析

MaxCompute湖仓一体方案

自建数据湖与云数仓的融合解决方案,将MaxCompute与自建的Hive集群做数据打通,通过存储共享,元数据镜像等方式,解决传统模式下的存储冗余,计算资源弹性能力弱的痛点。可大幅度增强系统的资源弹性,解决业务高峰期计算资源不足的问题。

数据分析

互联网、游戏等行业实时数仓构建

基于Flink构建实时数仓,包含采集日志,Flink对日志的拆分、处理写入ADB存储和HDFS。

数据分析

数据湖-在线学习场景数据分析

本场景以在线教育中一个答题闯关类的应用为例,使用Web Server来模拟演示这类 日志数据的分析处理。通过Nginx和Python flask搭建Web Server,模拟应用中的关 键页面,比如登录、课程内容等,之后构造若干用户使用的模拟日志数据,投递到数 据湖进行分析后获取应用PV、UV、课程内容访问排行、平均得分等等。

4948
数据分析

自建Hive数仓迁移到阿里云EMR

介绍如何将客户自建Hadoop/Hive数据仓库迁移到阿里云EMR的技术实现方案和实践步骤

4578
数据分析

EMR本地盘实例大规模数据集测试

使用阿里云EMR和D1本地盘实例实现大数据分析集群架构以及大规模数据集测试

4273
数据分析

大数据近实时数据投递MaxCompute

介绍离线大数据场景使用MaxCompute构建云上近实时数仓,打通云下数据上云链路,解决数据复杂类型支持和动态分区问题,满足高级数据处理需求的最佳实践。

数据分析

湖仓一体架构EMR元数据迁移DLF

通过EMR+DLF数据湖方案,可以为企业提供数据湖内的统一的元数据管理,统一的权限管理,支持多源数据入湖以及一站式数据探索的能力。本方案支持已有EMR集群元数据库使用RDS或内置MySQL数据库迁移DLF,通过统一的元数据管理,多种数据源入湖,搭建高效的数据湖解决方案。

安全&合规

EMR集群安全认证和授权管理 

介绍EMR高安全集群如何使用Kerberos和Apache Ranger进行鉴权和访问授权管理

2533
数据分析
|
机器学习

基于湖仓一体架构使用MaxCompute对OSS湖数据分析预测

数据湖和数据仓库是当前大数据技术条件下构建分布式系统的两种数据架构设计取向,数据湖偏向灵活性,数据仓库侧重成本、性能、安全、治理等企业级特性。但是数据湖和数据仓库的边界正在慢慢模糊,数据湖自身的治理能力、数据仓库延伸到外部存储的能力都在加强。在这样的背景之下,阿里云MaxCompute率先提出湖仓一体,为业界和用户展现了一种数据湖和数据仓湖互相补充,协同工作的架构。这样的架构同时为用户提供了数据湖的灵活性和数据仓库的诸多企业级特性,将用户使用大数据的总体拥有成本进一步降低。

数据分析
|
迁云

开源Flink迁移实时计算Flink全托管版最佳实践

本方案介绍如何将自建开源Flink集群的流式任务(包含Datastream、Table/SQL、PyFlink任务)迁移至阿里云实时计算全托管版。

数据分析

EMR on ECS快速部署

通过云速搭设计一个可以快速拉起EMR on ECS的模板

数据分析

EMR HBase on OSS存算分离集群快速恢复

OSS-HDFS服务(JindoFS服务)是一款云原生数据湖存储产品。基于统一的元数据管理能力,在完全兼容HDFS文件系统接口的同时,提供充分的POSIX能力支持,能更好地满足大数据和AI等领域的数据湖计算场景。

数据分析

可视化EMR on ACK快速部署

通过云速搭设计一个可以快速拉起EMR on ACK的模板

数据分析
|
云上运维

大数据系统基准性能测试最佳实践

本方案适用于在阿里云上进行大数据基准性能测试的场景,包括 Teragen和Terasort测试,TestDFSIO测试。本文采用CADT工具结合阿里云的E-MapReduce服务快速构建测试集群,并提供了Teragen和Terasort测试,TestDFSIO测试的测试脚本,便于迅速开展测试。

loading图标

探索阿里云产品,构建云上应用和服务

免费试用

探索阿里云产品,构建云上应用和服务

免费试用

证书查询

在下方输入手机号+姓名,可以查询对应认证/技术解决方案_最佳实践实训营结业证书信息。

证书编号

  • 证书编号
  • 手机号+姓名
查询

该手机号对应以下证书信息

  • 证书编号 证书名称 主题 姓名 手机号 起始时间 有效期 状态 证书
    返回证书查询 导出证书
    证书图片
    23232323
    南有乔木 2021 6 12
    云上IT治理
    证书图片
    23232323
    南有乔木 2021 6 12
    云上IT治理