问题

我试图重新创建使用Hudi（https://hudi.apache.org/docs/flink-quick-start-guide）的Flink常见示例，但当我尝试插入示例数据时出现错误，有人可以帮助我吗？

我在我的AWS EMR集群中遵循的步骤是：

export JVM_ARGS=-Djava.io.tmpdir=/mnt/tmp
sudo aws s3 cp MyBucketLocation/hudi-flink-bundle_2.11-0.10.0.jar /lib/flink/lib/hudi-flink-bundle_2.11-0.10.0.jar
#初始化Sql cli flink
/usr/lib/flink/bin/sql-client.sh

--创建表
CREATE TABLE t1(
  uuid VARCHAR(20) PRIMARY KEY NOT ENFORCED,
  name VARCHAR(10),
  age INT,
  ts TIMESTAMP(3),
  `partition` VARCHAR(20)
)
PARTITIONED BY (`partition`)
WITH (
  'connector' = 'hudi',
  'path' = 's3://issue-lmdl-s3-ldz/msk/Flink/kafka/',
  'table.type' = 'MERGE_ON_READ' -- 这将创建一个MERGE_ON_READ表，默认情况下是COPY_ON_WRITE
);

--按照文档插入
INSERT INTO t1 VALUES
  ('id1','Danny',23,TIMESTAMP '1970-01-01 00:00:01','par1'),
  ('id2','Stephen',33,TIMESTAMP '1970-01-01 00:00:02','par1'),
  ('id3','Julian',53,TIMESTAMP '1970-01-01 00:00:03','par2'),
  ('id4','Fabian',31,TIMESTAMP '1970-01-01 00:00:04','par2'),
  ('id5','Sophia',18,TIMESTAMP '1970-01-01 00:00:05','par3'),
  ('id6','Emma',20,TIMESTAMP '1970-01-01 00:00:06','par3'),
  ('id7','Bob',44,TIMESTAMP '1970-01-01 00:00:07','par4'),
  ('id8','Han',56,TIMESTAMP '1970-01-01 00:00:08','par4');

我使用的是EMR 6.8.0，并且sql cli flink已经可以与kafka一起使用，我只想以Hudi格式写入这些记录。

英文:

i'm trying to recreate the flink common example working with hudi (https://hudi.apache.org/docs/flink-quick-start-guide), but when I try to insert the example data an error appears, can someone help me with this?

The steps that I'm following in my AWS EMR cluster are:

export JVM_ARGS=-Djava.io.tmpdir=/mnt/tmp
sudo aws s3 cp MyBucketLocation/hudi-flink-bundle_2.11-0.10.0.jar /lib/flink/lib/hudi-flink-bundle_2.11-0.10.0.jar
#Init the Sql cli flink
/usr/lib/flink/bin/sql-client.sh

--Create table
CREATE TABLE t1(
  uuid VARCHAR(20) PRIMARY KEY NOT ENFORCED,
  name VARCHAR(10),
  age INT,
  ts TIMESTAMP(3),
  `partition` VARCHAR(20)
)
PARTITIONED BY (`partition`)
WITH (
  &#39;connector&#39; = &#39;hudi&#39;,
  &#39;path&#39; = &#39;s3://issue-lmdl-s3-ldz/msk/Flink/kafka/&#39;,
  &#39;table.type&#39; = &#39;MERGE_ON_READ&#39; -- this creates a MERGE_ON_READ table, by default is COPY_ON_WRITE
);

--Insert as the documentation
INSERT INTO t1 VALUES
  (&#39;id1&#39;,&#39;Danny&#39;,23,TIMESTAMP &#39;1970-01-01 00:00:01&#39;,&#39;par1&#39;),
  (&#39;id2&#39;,&#39;Stephen&#39;,33,TIMESTAMP &#39;1970-01-01 00:00:02&#39;,&#39;par1&#39;),
  (&#39;id3&#39;,&#39;Julian&#39;,53,TIMESTAMP &#39;1970-01-01 00:00:03&#39;,&#39;par2&#39;),
  (&#39;id4&#39;,&#39;Fabian&#39;,31,TIMESTAMP &#39;1970-01-01 00:00:04&#39;,&#39;par2&#39;),
  (&#39;id5&#39;,&#39;Sophia&#39;,18,TIMESTAMP &#39;1970-01-01 00:00:05&#39;,&#39;par3&#39;),
  (&#39;id6&#39;,&#39;Emma&#39;,20,TIMESTAMP &#39;1970-01-01 00:00:06&#39;,&#39;par3&#39;),
  (&#39;id7&#39;,&#39;Bob&#39;,44,TIMESTAMP &#39;1970-01-01 00:00:07&#39;,&#39;par4&#39;),
  (&#39;id8&#39;,&#39;Han&#39;,56,TIMESTAMP &#39;1970-01-01 00:00:08&#39;,&#39;par4&#39;);

I'm working with EMR 6.8.0 and sql cli flink has already worked with kafka, I just want to write this records in hudi format.

答案1

得分: 0

这是一个版本问题，我可以通过将hudi库的版本升级到1.15或更高版本来解决它。

英文:

It's a version problem, I could fix it upgrading the hudi library version to 1.15 or higher

通过集体智慧和协作来改善编程学习和解决问题的方式。致力于成为全球开发者共同参与的知识库，让每个人都能够通过互相帮助和分享经验来进步。

Flink SQL-Cli: Hudi is abstract

问题

答案1

有一些 Kafka 分区没有被分配给任何 Flink 消费者。

Flink Statefun引导和状态过期

Apply generic to deserialize in Kafka using Flink

如何以编程方式将文本写入 Flink 套接字？

What's the correct way to type hint an empty list as a literal in python?

如何在Highcharts Gantt中更改本地化的星期名称

如何在同一个流中使用多个过滤器和映射函数？

如何使用Map/Set来将代码优化到O(n)？

.NET MAUI Android在GitHub Actions上构建失败，错误代码为1。

如何在Playwright视觉比较中屏蔽多个定位器？

在C++中，可以使用可变模板参数来检索类型的内部类型。

selenium.common.exceptions.StaleElementReferenceException: Message: stale element reference: stale element not found

Creating and opening a URL to log in to Website via Basic Auth with Robot Framework/Selenium (Python)

AG Grid 在上下文菜单中以大文本形式打开

发表评论