2023年8月9日 14:12:52go评论134阅读模式

英文:

sed/grep to extract word between 2 characters

问题

我的句子是

abcde^10=fgi^11=jkl^12=lmn

这个序列也可以被打乱，例如

abcde^11=jkl^12=lmn^10=fgi

序列也可以是：

12=lmn^11=jkl^10=fgi^abcde

我想打印出 lmn。

我已经做到了这一步：

~$ echo abcde^10=fgi^11=jkl^12=lmn|grep -o '\^12=[^)]*\^' -> 这不会打印任何内容

~$ echo abcde^11=jkl^12=lmn^10=fgi|grep -o '\^12=[^)]*\^' -> 这会打印 ^12=lmn^

英文:

My sentence is

abcde^10=fgi^11=jkl^12=lmn

The sequence can be jumbled also
for eg.

abcde^11=jkl^12=lmn^10=fgi

The sequence can also be :

12=lmn^11=jkl^10=fgi^abcde

I want to print lmn.

I have gotten till thus far:

~$ echo abcde^10=fgi^11=jkl^12=lmn|grep -o &#39;\^12=[^)]*\^&#39; -&gt; this doesnt print anything

~$ echo abcde^11=jkl^12=lmn^10=fgi|grep -o &#39;\^12=[^)]*\^&#39; -&gt; this prints ^12=lmn^

答案1

得分: 2

使用GNU awk进行多字符RS的方法：

$ echo 'abcde^10=fgi^11=jkl^12=lmn' | awk -v RS='[\n^]' -F'=' '$1==12{print $2}'
lmn

$ echo '12=lmn^11=jkl^10=fgi^abcde' | awk -v RS='[\n^]' -F'=' '$1==12{print $2}'
lmn

或者使用任何awk：

$ echo 'abcde^10=fgi^11=jkl^12=lmn' | awk -v RS='^' -F'[=\n]' '$1==12{print $2}'
lmn

英文:

With GNU awk for multi-char RS:

$ echo &#39;abcde^10=fgi^11=jkl^12=lmn&#39; | awk -v RS=&#39;[\n^]&#39; -F&#39;=&#39; &#39;$1==12{print $2}&#39;
lmn

$ echo &#39;12=lmn^11=jkl^10=fgi^abcde&#39; | awk -v RS=&#39;[\n^]&#39; -F&#39;=&#39; &#39;$1==12{print $2}&#39;
lmn

or using any awk:

$ echo &#39;abcde^10=fgi^11=jkl^12=lmn&#39; | awk -v RS=&#39;^&#39; -F&#39;[=\n]&#39; &#39;$1==12{print $2}&#39;
lmn

<p>

$ echo &#39;abcde^10=fgi^11=jkl^12=lmn&#39; | awk -v RS=&#39;^&#39; -F&#39;[=\n]&#39; &#39;$1==12{print $2}&#39;
lmn

答案2

得分: 1

在GNU awk中，根据你展示的示例，你可以在while循环中使用awk的match函数和正则表达式(^|\^)12=([^^]*)。

awk '
{
  while(match($0,/(^|\^)12=([^^]*)/,arr)){
     print arr[2]
     $0=substr($0,RSTART+RLENGTH)
  }
}
' Input_file

英文:

With your shown samples in GNU awk, you can use match function of awk with regex (^|\^)12=([^^]*) in while loop.

awk &#39;
{
  while(match($0,/(^|\^)12=([^^]*)/,arr)){
     print arr[2]
     $0=substr($0,RSTART+RLENGTH)
  }
}
&#39; Input_file

答案3

得分: 0

如果你想提取在第一个12=和下一个^之间的部分（或者字符串的末尾，不确定），你不需要外部工具。bash的替换就足够了：

s='abcde^10=fgi^11=jkl^12=lmn'
s="${s#*12=}"; echo "${s%%^*}"

或者：

[[ "abcde^10=fgi^11=jkl^12=lmn" =~ .*12=([^^]*).* ]] && echo "${BASH_REMATCH[1]}"

但如果你更喜欢使用sed：

sed 's/.*12=\([^^]*\).*//' <<< 'abcde^10=fgi^11=jkl^12=lmn'

英文:

If you want to extract the part between the first 12= and the next ^ or the end of the string (not sure of that) you don't need external utilities. bash substitutions are enough:

s=&#39;abcde^10=fgi^11=jkl^12=lmn&#39;
s=&quot;${s#*12=}&quot;; echo &quot;${s%%^*}&quot;

Or:

[[ &quot;abcde^10=fgi^11=jkl^12=lmn&quot; =~ .*12=([^^]*).* ]] &amp;&amp; echo &quot;${BASH_REMATCH[1]}&quot;

But if you prefer sed:

sed &#39;s/.*12=\([^^]*\).*//&#39; &lt;&lt;&lt; &#39;abcde^10=fgi^11=jkl^12=lmn&#39;

答案4

得分: 0

使用grep和正向后顾断言（仅打印匹配项）：

grep -Po '(?<=12=)[^^]+'

使用sed（完全打印没有匹配项的行）：

sed -E 's/(^|.*\^)12=([^^]+).*//'

英文:

With grep using positive lookbehinds (prints only matches)

grep -Po &#39;(?&lt;=12=)[^^]+&#39;

With sed (prints lines wihtout matches entirely)

sed -E &#39;s/(^|.*\^)12=([^^]+).*//&#39;

答案5

得分: 0

你是指像这样吗？

echo '
abcde^10=fgi^11=jkl^12=lmn 
abcde^11=jkl^12=lmn^10=fgi
12=lmn^11=jkl^10=fgi^abcde' |

nawk 'gsub(/.*12=|\^.+/,_)^_'

gawk '$_=$2' FS='.*12=|\^.+'

mawk ++NF OFS= FS='.*12=|\^.+'

lmn 
lmn
lmn

英文:

you mean like this ?

echo &#39;
abcde^10=fgi^11=jkl^12=lmn 
abcde^11=jkl^12=lmn^10=fgi
12=lmn^11=jkl^10=fgi^abcde&#39; |

nawk &#39;gsub(/.*12=|\^.+/,_)^_&#39;

>
gawk '$_=$2' FS='.12=|\^.+'
>
mawk ++NF OFS= FS='.12=|^.+'

lmn 
lmn
lmn

答案6

得分: 0

$ echo 'abcde^10=fgi^11=jkl^12=lmn
abcde^11=jkl^12=lmn^10=fgi
12=lmn^11=jkl^10=fgi^abcde
' | awk -F'(^|^)12=' 'NF>1{sub(/^.*/,"",$NF); print $NF}'
lmn
lmn
lmn

英文:

$ echo &#39;abcde^10=fgi^11=jkl^12=lmn
abcde^11=jkl^12=lmn^10=fgi
12=lmn^11=jkl^10=fgi^abcde
&#39; | awk -F&#39;(^|\\^)12=&#39; &#39;NF&gt;1{sub(/\^.*/,&quot;&quot;,$NF); print $NF}&#39;
lmn
lmn
lmn

通过集体智慧和协作来改善编程学习和解决问题的方式。致力于成为全球开发者共同参与的知识库，让每个人都能够通过互相帮助和分享经验来进步。

sed/grep to extract word between 2 characters

问题

答案1

答案2

答案3

答案4

答案5

>
gawk '$_=$2' FS='.12=|\^.+'
>
mawk ++NF OFS= FS='.12=|^.+'

答案6

动态sed替换字符串的一部分

awk和sed用于重命名文件中带有索引的部分。

passing file names to a script which takes multiple arguments which are modified names of the input file using xargs

使用sed将单词/字符串转换为字符列表。

What's the correct way to type hint an empty list as a literal in python?

如何在Highcharts Gantt中更改本地化的星期名称

如何在同一个流中使用多个过滤器和映射函数？

如何使用Map/Set来将代码优化到O(n)？

.NET MAUI Android在GitHub Actions上构建失败，错误代码为1。

如何在Playwright视觉比较中屏蔽多个定位器？

在C++中，可以使用可变模板参数来检索类型的内部类型。

selenium.common.exceptions.StaleElementReferenceException: Message: stale element reference: stale element not found

Creating and opening a URL to log in to Website via Basic Auth with Robot Framework/Selenium (Python)

AG Grid 在上下文菜单中以大文本形式打开

发表评论

问题

答案1

答案2

答案3

答案4

答案5

> gawk '$_=$2' FS='.*12=|\^.+' > mawk ++NF OFS= FS='.*12=|^.+'

答案6

发表评论

>
gawk '$_=$2' FS='.12=|\^.+'
>
mawk ++NF OFS= FS='.12=|^.+'