大数据

奇发28网进步神速,Pandas 2.1来了!

本文将介绍Pandas 2.1中的新功能,探讨关于这个新版本中最有趣的事情。

编程学研
数据分析
2023-09-19 16:44

招商信诺人寿基于 Apache Doris 统一 OLAP 技术栈实践

招商信诺人寿基于 Apache Doris 实现 OLAP 技术栈统一,赋能 70 + 一线业务场景实时化

SelectDB
数据分析
2023-09-19 12:07

ClickHouse 存算分离改造:小红书自研云原生数据仓库实践

在保持 ClickHouse 原有超高性能的基础上,我们对其进行深度的云原生改造,实现了计算和存储层的弹性扩缩容能力,从而有效减轻运维负担并降低成本。

danny_2018
数据分析
2023-09-18 14:38

B站大数据系统诊断实践-SQLSCAN篇

在本篇文章中,我们主要介绍了B站大数据系统诊断在SQLScan所做的改造和阶段性成果,主要关注任务的事前治理,对于事中和事后的治理诊断,请关注后续文章《BMR大数据元仓》以及《大数据任务诊断系统-数据智囊》

大数据技术前线
数据分析
2023-09-18 13:49

幸福里基于 Flink & Paimon 的流式数仓实践

本文整理自字节跳动基础架构工程师李国君,在 Streaming Lakehouse Meetup 的分享。幸福里业务是一种典型的交易、事务类型的业务场景,这种业务场景在实时数仓建模中遇到了诸多挑战。本次分享主要介绍幸福里业务基于 Flink & Paimon 构建流式数仓的实践经验,从业务背景、流批一体数仓架构、实践中遇到的问题和解决方案,借助 Paimon 最终能拿到的收益,以及未来规划方面进行介绍。

大数据技术前线
数据分析
2023-09-15 09:44

一文了解袋鼠云在实时数据湖上的探索与实践

近日,袋鼠云大数据引擎专家郝卫亮,为大家带来了《袋鼠云在实时数据湖上的探索与实践》主题分享,帮助大家能了解到什么是实时数据湖、如何进行数据湖选型及数据平台建设数据湖的经验。如今,大规模、高时效、智能化数据处理已是“刚需”,企业需要更强大的数据处理能力,来应对数据查询、数据处理、数据挖掘、数据展示以及多种计算模型并行的挑战。因此,袋鼠云基于自研的一站式大数据基础软件——数栈提出相应的实时数据湖解决方

数栈DTinsight
Hadoop
2023-09-14 16:08

SmartNews 基于 Flink 的 Iceberg 实时数据湖实践

本文整理自 SmartNews 数据平台架构师 Apache Iceberg Contributor 戢清雨,在 Flink Forward Asia 2022 实时湖仓专场的分享。本篇内容主要分为五个部分:

大数据技术前线
数据分析
2023-09-14 09:31

数据研发“新人”如何快速落地?

以“如何快速落地”、“快速适应新环境”为出发点,探讨数据研发“新人”如何快速了解公司业务、领域模型和业务系统,然后快速高效的推进相关工作,赢得合作伙伴的信任和支持。

danny_2018
可视化
2023-09-13 15:19

什么让 Apache Kafka 如此快速?

Kafka 支持高吞吐量、高度分布式、容错性强的平台,能够以低延迟传递消息。

大数据技术前线
数据分析
2023-09-13 14:33

推荐三款适合运维小白的网络监测工具

对于刚刚步入职场的运维小白而言,面对工作中的突发情况时常会感到手忙脚乱,为了帮助他们更好地应对这些挑战,本文将介绍三款特别适合运维新手使用的网络监测工具:                    1.Zabbix是一个功能强大的网络监控系统,可以监视各种网络设备的性能指标、应用的运行状态等,并提供实时

小魏技术
数据分析
2023-09-13 11:16

性能、安全和稳定,DataAPI 为企业 API 保驾护航

对于 API 平台管理者、开发者和调用者来说,API 的调用性能、安全性和稳定性是在平台选型时最需要考虑的三个因素。本文将为大家分享 袋鼠云数据服务平台DataAPI 是如何实现这三方面保障的。

数栈DTinsight
Hadoop
2023-09-13 11:12

大数据实时链路备战——数据双流高保真压测

在企业的业务经营中,实时数据是营销、运维、决策的重要支撑,实时数据链路基本是所有大公司所拥有的,无论是否采用了中台模式,本文从如何建设实时数据双流、数据双流的建设标准,以及数据双流的压测备战三方面进行了详细的论述。

大数据技术前线
数据分析
2023-09-13 10:06

实时分析融合统一云原生,现代化数据仓库未来发展必经之路|专访飞轮科技 CEO 马如悦

Apache Doris 历经近十年的发展,为何还能持续保持竞争力和活力?其背后的核心推动力又是什么?

SelectDB
数据分析
2023-09-12 11:05

从 Clickhouse 到 Apache Doris:有赞业务场景下性能测试与迁移验证

从 Clickhouse 到 Apache Doris 迁移实践:有赞查询提速近 10 倍,OLAP 分析更实时高效!

SelectDB
数据分析
2023-09-11 11:38

Hadoop主要是用来做什么的呢?

Hadoop以一种可靠、高效、可伸缩的方式进行数据处理,用户可以在不了解分布式底层细节的情况下开发分布式程序。主要解决海量数据存储与计算的问题,是大数据技术中的基石。 Hadoop用途:海量数据存储HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(High throughput)来访问数据,适合那些有着超大数据集(large data se

候鸟之恋
Hadoop
2023-09-08 15:09

奇发28网ClickHouse 存算分离改造:小红书自研云原生数据仓库实践

ClickHouse 作为业界性能最强大的 OLAP 系统,在小红书内部被广泛应用于广告、社区、直播和电商等多个业务领域。然而,原生 ClickHouse 的 MPP 架构在运维成本、弹性扩展和故障恢复方面存在较大局限性。为应对挑战,小红书数据流团队基于开源 ClickHouse 自主研发了云原生实时数据仓库 RED ClickHouse(以下简称“REDck”)。

大数据技术前线
数据分析
2023-09-07 10:12

国产数仓的机遇与野心

可见,新需求与新场景的不断提升重新定义着数智化时代数据仓库的新标准,从而为国产数据仓库产品的“弯道超车”创造了机遇。

danny_2018
数据挖掘
2023-09-06 14:25

Apache Doris 2.0 如何实现导入性能提升 2-8 倍

Apache Doris 2.0 进一步增强数据导入能力,性能提升 2-8 倍,加速数据实时处理和分析效率!

SelectDB
数据分析
2023-09-06 12:08

“数据驱动”时代,企业为什么需要实时湖仓?

随着业务对数据时效性要求的提高,许多企业的实时任务体量,正在逐步接近存量离线任务。实时湖仓解决方案,利用湖存储的特性和 Flink 的流批计算能力,统一存储和计算,无疑会是企业当前最优的选择。

数栈DTinsight
Hadoop
2023-09-06 10:54

Apache Doris 2.0.1 & 1.2.7 版本正式发布!

Apache Doris 2.0.1 & 1.2.7 版本正式发布,欢迎大家下载体验!

SelectDB
数据分析
2023-09-05 14:39
联系我们

商务合作:

Tel: +86-15801238530

Email:sales@奇发28网 www.cibkglfj.cn

媒体合作:

Email:edit@it168.com

关注公众号获取更多技术文章

赏帮赚
无障碍浏览