问题

Date Dividend
05/05/2005 $367.62
05/05/2006 $415.70

英文:

I have a string as such:

&quot;05/05/2005 ANNIVERSARY $367.62 ANNUAL DIVIDEND DECLARED UNDER THE PAIO UP ADDITIONS 20,965 2,203 23,168 | PAID UP ADDITION OPTION. $367.62 PURCHASED PAID UP ADDITIONS OF 2,203 02/15/2006 WITHDRAWAL ($77.50) VALUE OF PAID UP ADDITIONS OF 464 PAID UP ADDITIONS 23,168 (464) 22,704 APPLIED TOWARDS CHECK-O-MATIC PREMIUM DUE 03/05/2006 04/11/2006 05/05/2006 ANNIVERSARY $415.70&quot;

I would like to create a data frame in R to extract the date and dollar amounts after the word ANNIVERSARY for the entire string.
Date Dividend
05/05/2005 $367.62
05/05/2006 $415.70

Thank you in advance.

I tried splitting the string with str_split but don't know where to go from there.

答案1

得分: 1

如果我们只想提取美元金额和日期，我们可以使用 str_extract 与正则表达式查找（或在新版本中使用捕获组）

library(stringr)
library(tibble)
dates &lt;- str_extract_all(str1, &quot;\\d{2}/\\d{2}/\\d{4}(?=\\s+ANNIVERSARY)&quot;)[[1]]
amounts &lt;- str_extract_all(str1, &quot;(?&lt;=ANNIVERSARY )\\$[0-9.]+&quot;)[[1]]
tibble(dates, amounts)
# A tibble: 2 &#215; 2
  dates      amounts
  &lt;chr&gt;      &lt;chr&gt;  
1 05/05/2005 $367.62
2 05/05/2006 $415.70

或者另一种选择是提取包含 'ANNIVERSARY' 的子字符串，然后使用 read.table/fread 读取

library(data.table)
fread(text = str_extract_all(str1, &quot;\\S+\\s+ANNIVERSARY\\s+\\S+&quot;)[[1]], 
   header = FALSE, col.names = c(&quot;dates&quot;, &quot;amounts&quot;), drop = 2)
       dates amounts
1: 05/05/2005 $367.62
2: 05/05/2006 $415.70

数据

str1 &lt;- &quot;05/05/2005 ANNIVERSARY $367.62 ANNUAL DIVIDEND DECLARED UNDER THE PAIO UP ADDITIONS 20,965 2,203 23,168 | PAID UP ADDITION OPTION. $367.62 PURCHASED PAID UP ADDITIONS OF 2,203 02/15/2006 WITHDRAWAL ($77.50) VALUE OF PAID UP ADDITIONS OF 464 PAID UP ADDITIONS 23,168 (464) 22,704 APPLIED TOWARDS CHECK-O-MATIC PREMIUM DUE 03/05/2006 04/11/2006 05/05/2006 ANNIVERSARY $415.70&quot;

英文:

If we just want to extract the dollar amounts and date, we may use str_extract with a regex lookaround (or in the new version with capture group)

library(stringr)
library(tibble)
dates &lt;- str_extract_all(str1, &quot;\\d{2}/\\d{2}/\\d{4}(?=\\s+ANNIVERSARY)&quot;)[[1]]
amounts &lt;- str_extract_all(str1, &quot;(?&lt;=ANNIVERSARY )\$[0-9.]+&quot;)[[1]]
tibble(dates, amounts)
# A tibble: 2 &#215; 2
  dates      amounts
  &lt;chr&gt;      &lt;chr&gt;  
1 05/05/2005 $367.62
2 05/05/2006 $415.70

Or another option is to extract the substring containing 'ANNIVERSARY', read with read.table/fread

library(data.table)
fread(text = str_extract_all(str1, &quot;\\S+\\s+ANNIVERSARY\\s+\\S+&quot;)[[1]], 
   header = FALSE, col.names = c(&quot;dates&quot;, &quot;amounts&quot;), drop = 2)
       dates amounts
1: 05/05/2005 $367.62
2: 05/05/2006 $415.70

data

str1 &lt;- &quot;05/05/2005 ANNIVERSARY $367.62 ANNUAL DIVIDEND DECLARED UNDER THE PAIO UP ADDITIONS 20,965 2,203 23,168 | PAID UP ADDITION OPTION. $367.62 PURCHASED PAID UP ADDITIONS OF 2,203 02/15/2006 WITHDRAWAL ($77.50) VALUE OF PAID UP ADDITIONS OF 464 PAID UP ADDITIONS 23,168 (464) 22,704 APPLIED TOWARDS CHECK-O-MATIC PREMIUM DUE 03/05/2006 04/11/2006 05/05/2006 ANNIVERSARY $415.70&quot;

通过集体智慧和协作来改善编程学习和解决问题的方式。致力于成为全球开发者共同参与的知识库，让每个人都能够通过互相帮助和分享经验来进步。

在R中从遵循特定关键字的字符串创建一个数据框。

问题

答案1

数据

data

在R中创建一个数值求和的Venn图。

Java 14或15中的字符串插值

为什么我不能像Go参考文档中指定的那样将字符串追加到字节切片中？

Tidy eval for `by` in `dplyr::_join`可翻译为：`dplyr::_join` 中的 `by` 的整洁评估

What's the correct way to type hint an empty list as a literal in python?

如何在Highcharts Gantt中更改本地化的星期名称

如何在同一个流中使用多个过滤器和映射函数？

如何使用Map/Set来将代码优化到O(n)？

.NET MAUI Android在GitHub Actions上构建失败，错误代码为1。

如何在Playwright视觉比较中屏蔽多个定位器？

在C++中，可以使用可变模板参数来检索类型的内部类型。

selenium.common.exceptions.StaleElementReferenceException: Message: stale element reference: stale element not found

Creating and opening a URL to log in to Website via Basic Auth with Robot Framework/Selenium (Python)

AG Grid 在上下文菜单中以大文本形式打开

发表评论