2023年7月17日 22:46:39go评论91阅读模式

英文:

How to add additional layers to CNN model in PyTorch?

问题

我有一个与神经网络相关的问题。在指定模型参数方面，我是一个初学者。我发现了这个关于在PyTorch中构建的DNA序列模型的示例，我想进行改进。在示例中，部署了一个基本的CNN模型，现在我想部署一个更深的模型，具有更多的层次。

基本的CNN模型

这些不是优化过的模型，只是一些初始尝试，用于测试PyTorch在DNA上下文中的使用

class DNA_CNN(nn.Module):
def init(self,
seq_len,
num_filters=32,
kernel_size=3):
super().init()
self.seq_len = seq_len

    self.conv_net = nn.Sequential(
        # 4代表4个核苷酸
        nn.Conv1d(4, num_filters, kernel_size=kernel_size),
        nn.ReLU(inplace=True),
        nn.Flatten(),
        nn.Linear(num_filters*(seq_len-kernel_size+1), 1)
    ) 
def forward(self, xb):
    # 重新整形视图为batch_size x 4通道 x seq_len
    # 转置以正确排序通道
    xb = xb.permute(0,2,1) 
    
    #print(xb.shape)
    out = self.conv_net(xb)
    return out

英文:

I have a question related to neural networks. I am a beginner in terms of specifying model parameters. I found this amazing example about DNA seq model built in PyTorch, which I want to improve. In the example, a basic CNN model was deployed and now I want to deploy a deeper model with more layers.

# basic CNN model
# These aren&#39;t optimized models, just something to start with, just testing pytorch with context of DNA
class DNA_CNN(nn.Module):
    def __init__(self,
                 seq_len,
                 num_filters=32,
                 kernel_size=3):
        super().__init__()
        self.seq_len = seq_len
        
        self.conv_net = nn.Sequential(
            # 4 is for the 4 nucleotides
            nn.Conv1d(4, num_filters, kernel_size=kernel_size),
            nn.ReLU(inplace=True),
            nn.Flatten(),
            nn.Linear(num_filters*(seq_len-kernel_size+1), 1)
        ) 
    def forward(self, xb):
        # reshape view to batch_size x 4channel x seq_len
        # permute to put channel in correct order
        xb = xb.permute(0,2,1) 
        
        #print(xb.shape)
        out = self.conv_net(xb)
        return out

答案1

得分: 1

使用相同的填充来实现模块化代码，以保持序列的长度（在应用卷积之前在边界添加零）：
from typing import List
class DNA_CNN(nn.Module):
    def __init__(self,
                 seq_len: int,
                 num_filters: List[int] = [32, 64],
                 kernel_size: int = 3):
        super().__init__()
        self.seq_len = seq_len
        # CNN 模块
        self.conv_net = nn.Sequential()
        num_filters = [4] + num_filters
        for idx in range(len(num_filters) - 1):
            self.conv_net.add_module(
                f"conv_{idx}",
                nn.Conv1d(num_filters[idx], num_filters[idx + 1],
                          kernel_size=kernel_size, padding='same')
            )
            self.conv_net.add_module(f"relu_{idx}", nn.ReLU(inplace=True))
        self.conv_net.add_module("flatten", nn.Flatten())
        self.conv_net.add_module(
            "linear",
            nn.Linear(num_filters[-1]*seq_len, 1)
        )
        
    def forward(self, xb: torch.Tensor):
        """前向传播."""
        xb = xb.permute(0, 2, 1) 
        out = self.conv_net(xb)
        return out

要更改内核大小，您可以传递一个列表给 kernel_size，然后在卷积中使用 kernel_size=kernel_size[idx]。

如果出于某种原因您想要移除填充，您可以在卷积中移除 padding='same'，并更改 Linear 定义以匹配新的形状：

nn.Linear(num_filters[-1] * (seq_len - (len(num_filters)-1) * (kernel_size-1), 1)

英文:

Modular code to do so using padding same to keep the length of the sequence (by adding zeros in the borders before applying convolutions):

from typing import List
class DNA_CNN(nn.Module):
    def __init__(self,
                 seq_len: int,
                 num_filters: List[int] = [32, 64],
                 kernel_size: int = 3):
        super().__init__()
        self.seq_len = seq_len
        # CNN module
        self.conv_net = nn.Sequential()
        num_filters = [4] + num_filters
        for idx in range(len(num_filters) - 1):
            self.conv_net.add_module(
                f&quot;conv_{idx}&quot;,
                nn.Conv1d(num_filters[idx], num_filters[idx + 1],
                          kernel_size=kernel_size, padding=&#39;same&#39;)
            )
            self.conv_net.add_module(f&quot;relu_{idx}&quot;, nn.ReLU(inplace=True))
        self.conv_net.add_module(&quot;flatten&quot;, nn.Flatten())
        self.conv_net.add_module(
            &quot;linear&quot;,
            nn.Linear(num_filters[-1]*seq_len, 1)
        )
        
    def forward(self, xb: torch.Tensor):
        &quot;&quot;&quot;Forward pass.&quot;&quot;&quot;
        xb = xb.permute(0, 2, 1) 
        out = self.conv_net(xb)
        return out

To change the kernel size, you can pass a list to kernel_size and simply use kernel_size=kernel_size[idx] in the convolution.

If for some reasons you want to remove the padding you can remove padding='same' in convolution and change the Linear definition to match the new shape:

nn.Linear(num_filters[-1] * (seq_len - (len(num_filters)-1) * (kernel_size-1), 1)

通过集体智慧和协作来改善编程学习和解决问题的方式。致力于成为全球开发者共同参与的知识库，让每个人都能够通过互相帮助和分享经验来进步。

如何在PyTorch中为CNN模型添加额外的层？

问题

基本的CNN模型

这些不是优化过的模型，只是一些初始尝试，用于测试PyTorch在DNA上下文中的使用

答案1

如何解决深度学习中的广播问题？

torch.onnx.export报告：“未安装模块onnx！”

使用`nn.Linear(…)`到`nn.Parameter(torch.tensor(…))`会导致性能下降。

尝试安装最新的Pytorch（1.13.1），实际安装的是1.11.0。

如何在Playwright视觉比较中屏蔽多个定位器？

在C++中，可以使用可变模板参数来检索类型的内部类型。

selenium.common.exceptions.StaleElementReferenceException: Message: stale element reference: stale element not found

Creating and opening a URL to log in to Website via Basic Auth with Robot Framework/Selenium (Python)

AG Grid 在上下文菜单中以大文本形式打开

What's the correct way to type hint an empty list as a literal in python?

如何在Highcharts Gantt中更改本地化的星期名称

如何在同一个流中使用多个过滤器和映射函数？

如何使用Map/Set来将代码优化到O(n)？

.NET MAUI Android在GitHub Actions上构建失败，错误代码为1。