Handle problem with attention_slotwise

30c62cd9 · Alexandre Chapin · 6563a107 · 6563a107 · 30c62cd9 · 30c62cd9
Commit 30c62cd9 authored 1 year ago by Alexandre Chapin
--- a/.visualisation_0.png
+++ b/.visualisation_0.png
--- a/.visualisation_1.png
+++ b/.visualisation_1.png
--- a/Nonevisualisation_0.png
+++ b/Nonevisualisation_0.png
--- a/lightning_logs/version_0/events.out.tfevents.1690289036.achapin-Precision-5570.74650.0
+++ b/lightning_logs/version_0/events.out.tfevents.1690289036.achapin-Precision-5570.74650.0
--- a/lightning_logs/version_0/hparams.yaml
+++ b/lightning_logs/version_0/hparams.yaml
-{}
--- a/lightning_logs/version_1/events.out.tfevents.1690289388.achapin-Precision-5570.76271.0
+++ b/lightning_logs/version_1/events.out.tfevents.1690289388.achapin-Precision-5570.76271.0
--- a/lightning_logs/version_1/hparams.yaml
+++ b/lightning_logs/version_1/hparams.yaml
-{}
--- a/lightning_logs/version_2/events.out.tfevents.1690294616.achapin-Precision-5570.88157.0
+++ b/lightning_logs/version_2/events.out.tfevents.1690294616.achapin-Precision-5570.88157.0
--- a/lightning_logs/version_2/hparams.yaml
+++ b/lightning_logs/version_2/hparams.yaml
-{}
--- a/lightning_logs/version_3/events.out.tfevents.1690294661.achapin-Precision-5570.88480.0
+++ b/lightning_logs/version_3/events.out.tfevents.1690294661.achapin-Precision-5570.88480.0
--- a/lightning_logs/version_3/hparams.yaml
+++ b/lightning_logs/version_3/hparams.yaml
-{}
--- a/lightning_logs/version_4/events.out.tfevents.1690295005.achapin-Precision-5570.89889.0
+++ b/lightning_logs/version_4/events.out.tfevents.1690295005.achapin-Precision-5570.89889.0
--- a/lightning_logs/version_4/hparams.yaml
+++ b/lightning_logs/version_4/hparams.yaml
-{}
--- a/lightning_logs/version_5/events.out.tfevents.1690362262.achapin-Precision-5570.9831.0
+++ b/lightning_logs/version_5/events.out.tfevents.1690362262.achapin-Precision-5570.9831.0
--- a/lightning_logs/version_5/hparams.yaml
+++ b/lightning_logs/version_5/hparams.yaml
-{}
--- a/osrt/model.py
+++ b/osrt/model.py
@@ -100,7 +100,7 @@ class LitSlotAttentionAutoEncoder(pl.LightningModule):
        masks = masks.softmax(dim = 1)
        recon_combined = (recons * masks).sum(dim = 1)

-        return recon_combined, recons, masks, slots, attn_slotwise.unsqueeze(-2).unflatten(-1, x.shape[-2:])
+        return recon_combined, recons, masks, slots, attn_slotwise.unsqueeze(-2).unflatten(-1, x.shape[-2:]) if attn_slotwise is not None else None
    
    def configure_optimizers(self) -> Any:
        optimizer = optim.Adam(self.parameters(), lr=1e-3, eps=1e-08)
@@ -108,7 +108,7 @@ class LitSlotAttentionAutoEncoder(pl.LightningModule):
    
    def one_step(self, image):
        x = self.encoder(image)
-        
+        attn_shape = x.shape[-3:-1]
        slots, attn_logits, attn_slotwise = self.slot_attention(x.flatten(start_dim = 1, end_dim = 2))
        x = slots.reshape(-1, 1, 1, slots.shape[-1]).expand(-1, *self.decoder.decoder_initial_size, -1)
        x = self.decoder(x)
@@ -120,8 +120,9 @@ class LitSlotAttentionAutoEncoder(pl.LightningModule):
        recons, masks = x.split((3, 1), dim = 2)
        masks = masks.softmax(dim = 1)
        recon_combined = (recons * masks).sum(dim = 1)
-
-        return recon_combined, recons, masks, slots, attn_slotwise.unsqueeze(-2).unflatten(-1, x.shape[-2:]) if attn_slotwise is not None else None
+        
+        
+        return recon_combined, recons, masks, slots, attn_slotwise.unsqueeze(-2).unflatten(-1, attn_shape) if attn_slotwise is not None else None

    def training_step(self, batch, batch_idx):
        """Perform a single training step."""

--- a/outputsvisualisation_2.png
+++ b/outputsvisualisation_2.png
--- a/outputsvisualisation_3.png
+++ b/outputsvisualisation_3.png
--- a/visualize_sa.py
+++ b/visualize_sa.py
@@ -26,7 +26,7 @@ def main():
    parser.add_argument('--wandb', action='store_true', help='Log run to Weights and Biases.')
    parser.add_argument('--seed', type=int, default=0, help='Random seed.')
    parser.add_argument('--ckpt', type=str, default=".", help='Model checkpoint path')
-    parser.add_argument('--output', type=str, default=".", help='Folder in which to save images')
+    parser.add_argument('--output', type=str, default="./outputs", help='Folder in which to save images')
    parser.add_argument('--step', type=int, default=".", help='Step of the model')

    args = parser.parse_args()