英文: AWS Glue Job Run continuously 问题 有没有任何替代方案? 英文: I want to run a Glue ETL job continuously (i.e. ...
Data Profiling using Pyspark
英文: Data Profiling using Pyspark 问题 我正在尝试创建一个可以接受DataFrame作为输入并返回数据概要报告的PySpark函数。我已经使用了describe和sum...
AWS Athena 中在 Glue 目录中创建的表是空的
英文: AWS Athena table created in Glue catalog is empty 问题 我正在尝试在S3 Parquet文件上创建Athena表格。 我在Glue目录中创建了...
在 AWS Glue 作业中运行 R。
英文: Running R in an AWS Glue job 问题 可以将R脚本作为Python子进程(或包装一组R脚本的bash脚本)在具有Python和R依赖项的AWS Glue作业中运行吗?...
将连接附加到由AWS Airflow编排的Glue作业
英文: Attach connection to Glue job orchestrated by AWS Airflow 问题 我正在尝试通过Airflow触发一个Glue作业。触发功能运行得很好,...
AWS Glue使用Cloud Formation创建的JDBC连接未设置密码。
英文: AWS Glue JDBC Connection created using Cloud Formation is not setting the password 问题 如果我创建一个连接到...
“Glue自定义可视脚本无限运行”
英文: Glue Custom Visual Script Running indefinitely 问题 I am trying to create a Custom Visual Transfor...
‘JavaPackage’对象在AWS Glue上不可调用。
英文: Error: 'JavaPackage' object is not callable on aws glue 问题 我一直在尝试使用 Spark 库 XSDToSchema ...
Transform – 自定义代码 – 使用2个滤镜很好,但想要3个或更多滤镜?
英文: Transform - Custom Code - runs great w 2 filters but want 3+ filters? 问题 在AWS Glue Studio中,我创建了一...
Python多进程在同一个AWS Glue 4.0作业中卡住
英文: Python mutiprocessing within the same AWS Glue 4.0 job hangs 问题 我试图使用Python的多进程来在同一个AWS Glue 4.0...
4