/* * Copyright (c) 2003, 2006 Matteo Frigo * Copyright (c) 2003, 2006 Massachusetts Institute of Technology * * This program is free software; you can redistribute it and/or modify * it under the terms of the GNU General Public License as published by * the Free Software Foundation; either version 2 of the License, or * (at your option) any later version. * * This program is distributed in the hope that it will be useful, * but WITHOUT ANY WARRANTY; without even the implied warranty of * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the * GNU General Public License for more details. * * You should have received a copy of the GNU General Public License * along with this program; if not, write to the Free Software * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA * */ /* This file was automatically generated --- DO NOT EDIT */ /* Generated on Tue Mar 7 10:49:58 EST 2006 */ #include "config.h" /* cheap-mode: VECTGRADE_FULL succeeded. (3152 steps) */ /* Generated by: ../../../genfft-k7/gen_twiddle -no-randomized-cse -dif -n 64 -sign 1 -name f1k7i_64 */ /* * Generator Id's : * $Id: algsimp.ml,v 1.4 2006-01-05 03:04:27 stevenj Exp $ * $Id: fft.ml,v 1.4 2006-01-05 03:04:27 stevenj Exp $ * $Id: gen_twiddle.ml,v 1.14 2005-12-24 21:08:49 athena Exp $ */ /* The following asm code is Copyright (c) 2000-2001 Stefan Kral */ .section .rodata .balign 64 chs_lo: .long 0x80000000, 0x00000000 chs_hi: .long 0x00000000, 0x80000000 KP707106781KP707106781: .float +0.707106781186547524400844362104849039284835938, +0.707106781186547524400844362104849039284835938 KP831469612KP555570233: .float +0.831469612302545237078788377617905756738560812, +0.555570233019602224742830813948532874374937191 KP195090322KP980785280: .float +0.195090322016128267848284868477022240927691618, +0.980785280403230449126182236134239036973933731 KP555570233KP831469612: .float +0.555570233019602224742830813948532874374937191, +0.831469612302545237078788377617905756738560812 KP980785280KP195090322: .float +0.980785280403230449126182236134239036973933731, +0.195090322016128267848284868477022240927691618 KP923879532KP382683432: .float +0.923879532511286756128183189396788286822416626, +0.382683432365089771728459984030398866761344562 KP382683432KP923879532: .float +0.382683432365089771728459984030398866761344562, +0.923879532511286756128183189396788286822416626 KP773010453KP634393284: .float +0.773010453362736960810906609758469800971041293, +0.634393284163645498215171613225493370675687095 KP634393284KP773010453: .float +0.634393284163645498215171613225493370675687095, +0.773010453362736960810906609758469800971041293 KP098017140KP995184726: .float +0.098017140329560601994195563888641845861136673, +0.995184726672196886244836953109479921575474869 KP995184726KP098017140: .float +0.995184726672196886244836953109479921575474869, +0.098017140329560601994195563888641845861136673 KP956940335KP290284677: .float +0.956940335732208864935797886980269969482849206, +0.290284677254462367636192375817395274691476278 KP290284677KP956940335: .float +0.290284677254462367636192375817395274691476278, +0.956940335732208864935797886980269969482849206 KP471396736KP881921264: .float +0.471396736825997648556387625905254377657460319, +0.881921264348355029712756863660388349508442621 KP881921264KP471396736: .float +0.881921264348355029712756863660388349508442621, +0.471396736825997648556387625905254377657460319 .text .text .balign 64 f1k7i_64: subl $1860, %esp femms movl 1876(%esp), %edx movl 1868(%esp), %ecx movl %ebx, 1856(%esp) movl 1872(%esp), %eax movl %esi, 1852(%esp) movl %edi, 1848(%esp) leal (,%edx,4), %edx movl %ebp, 1844(%esp) movl %edx, %ebx sall $5, %ebx addl %ecx, %ebx sall $2, 1884(%esp) .p2align 4,,7 .L0: /* promise simd cell size = 8 */ movq (%ecx), %mm1 movq (%ebx), %mm0 leal (%edx,%edx), %esi leal (%edx,%edx,2), %edi movq (%ebx,%esi,8), %mm3 movq (%ecx,%esi,8), %mm4 leal (%edi,%edx,8), %ebp movq (%ebx,%edi,8), %mm7 movq %mm1, %mm2 movq (%ecx,%edi,8), %mm6 pfsub %mm0, %mm1 leal (%ebp,%edx,4), %esi pfadd %mm0, %mm2 movq %mm4, %mm5 pfadd %mm3, %mm4 movq %mm7, %mm0 pfadd %mm6, %mm7 pfsub %mm3, %mm5 movq %mm1, 0(%esp) movq (%ebx,%edx,8), %mm1 pfsub %mm6, %mm0 movq %mm2, %mm3 movq (%ecx,%edx,8), %mm6 pfsub %mm4, %mm2 pfadd %mm4, %mm3 movq %mm5, 24(%esp) movq %mm6, %mm4 pfadd %mm1, %mm6 movq %mm2, 32(%esp) movq %mm3, 64(%esp) movq (%ecx,%ebp,2), %mm2 movq (%ebx,%ebp,2), %mm3 pfsub %mm1, %mm4 leal (%edi,%edx,4), %ebp movq %mm6, %mm5 pfadd %mm7, %mm6 movq %mm3, %mm1 pfsubr %mm7, %mm5 movq %mm4, %mm7 pfadd %mm2, %mm3 pfsub %mm2, %mm1 movq %mm6, 56(%esp) movq (%ecx,%esi,2), %mm2 movq (%ebx,%esi,2), %mm6 pfpnacc %mm0, %mm7 pswapd %mm0, %mm0 movq %mm5, 48(%esp) leal (%edx,%edx,8), %esi pfpnacc %mm4, %mm0 movq (%ebx,%edi,2), %mm4 movq %mm6, %mm5 pfsub %mm2, %mm6 movq %mm7, 8(%esp) movq (%ecx,%edi,2), %mm7 pfadd %mm2, %mm5 movq %mm0, 16(%esp) movq %mm6, 40(%esp) movq (%ebx,%ebp,2), %mm2 movq (%ecx,%ebp,2), %mm6 movq %mm7, %mm0 pfadd %mm4, %mm7 pfsub %mm4, %mm0 movq %mm6, %mm4 pfadd %mm2, %mm6 pfsub %mm2, %mm4 movq %mm5, %mm2 pfsub %mm6, %mm2 pfadd %mm6, %mm5 movq %mm7, %mm6 pfadd %mm3, %mm7 pxor chs_lo, %mm4 pfsub %mm3, %mm6 movq %mm0, %mm3 movq %mm2, 80(%esp) pfpnacc %mm1, %mm3 pswapd %mm1, %mm1 movq %mm5, %mm2 pfadd %mm7, %mm5 movq %mm4, 112(%esp) movq (%ebx,%edi,4), %mm4 pfpnacc %mm0, %mm1 pxor chs_hi, %mm6 movq (%ecx,%edi,4), %mm0 pfsub %mm7, %mm2 leal (%edx,%edx,4), %edi movq %mm3, 96(%esp) movq %mm5, 120(%esp) movq %mm1, 104(%esp) movq (%ebx,%edx,4), %mm3 movq (%ecx,%edx,4), %mm5 movq (%ebx,%ebp,4), %mm1 movq %mm0, %mm7 movq %mm2, 88(%esp) movq (%ecx,%ebp,4), %mm2 pfadd %mm4, %mm0 movq %mm6, 72(%esp) pfsub %mm4, %mm7 leal (%esi,%edx,4), %ebp movq %mm5, %mm6 pfsub %mm3, %mm5 movq %mm1, %mm4 pfadd %mm3, %mm6 movq (%ebx,%edi,4), %mm3 pfadd %mm2, %mm1 pxor chs_lo, %mm7 pfsub %mm2, %mm4 movq %mm5, 128(%esp) movq (%ecx,%edi,4), %mm2 movq %mm2, %mm5 pfadd %mm3, %mm2 pswapd %mm4, %mm4 pfsub %mm3, %mm5 movq %mm6, %mm3 pfsub %mm2, %mm3 pfadd %mm2, %mm6 movq %mm1, %mm2 pfsub %mm0, %mm1 pxor chs_lo, %mm5 pfadd %mm0, %mm2 movq %mm4, %mm0 movq %mm3, 136(%esp) pfadd %mm7, %mm4 movq %mm6, %mm3 pfsub %mm7, %mm0 movq %mm1, 144(%esp) movq 128(%esp), %mm7 pfsubr %mm2, %mm3 pfadd %mm2, %mm6 movq %mm4, 176(%esp) movq (%ecx,%edx,2), %mm4 pswapd %mm7, %mm7 movq %mm0, 160(%esp) movq %mm3, 192(%esp) movq (%ebx,%edx,2), %mm2 movq (%ebx,%edi,2), %mm3 movq %mm7, %mm1 movq %mm6, 184(%esp) movq (%ecx,%edi,2), %mm6 pfadd %mm5, %mm7 pfsub %mm5, %mm1 movq %mm4, %mm0 pfadd %mm2, %mm4 pfsub %mm2, %mm0 movq (%ebx,%esi,2), %mm2 movq %mm6, %mm5 pfsub %mm3, %mm6 movq %mm7, 168(%esp) movq %mm1, 152(%esp) movq (%ecx,%esi,2), %mm7 leal (%edi,%edx,2), %esi pfadd %mm3, %mm5 movq (%ecx,%ebp,2), %mm3 leal (%edx,%edx,2), %edi movq %mm6, 200(%esp) movq (%ebx,%ebp,2), %mm6 leal (%esi,%edi,8), %ebp movq %mm7, %mm1 pfadd %mm2, %mm7 leal (%esi,%edx,8), %edi pfsub %mm2, %mm1 movq %mm6, %mm2 pfadd %mm3, %mm6 pfsub %mm3, %mm2 movq %mm4, %mm3 pfadd %mm7, %mm4 pfsub %mm7, %mm3 pswapd %mm1, %mm7 pxor chs_lo, %mm1 pxor chs_lo, %mm7 movq %mm3, 208(%esp) pswapd %mm0, %mm3 pfadd %mm1, %mm3 movq %mm5, %mm1 pfadd %mm6, %mm5 pfsub %mm6, %mm1 movq 200(%esp), %mm6 pfadd %mm7, %mm0 pswapd %mm2, %mm7 pfpnacc %mm6, %mm7 pxor chs_hi, %mm1 pfpnacc %mm2, %mm6 movq %mm4, %mm2 movq %mm0, 232(%esp) pfadd %mm5, %mm4 pfsub %mm5, %mm2 movq %mm1, 240(%esp) movq 120(%esp), %mm5 movq %mm6, %mm0 pfacc %mm7, %mm6 movq %mm4, %mm1 pfnacc %mm7, %mm0 movq 64(%esp), %mm7 pfsubr %mm5, %mm4 pfadd %mm5, %mm1 movq 56(%esp), %mm5 pfmul KP707106781KP707106781, %mm6 pfmul KP707106781KP707106781, %mm0 movq %mm4, 224(%esp) movq %mm7, %mm4 pfsub %mm5, %mm7 pfadd %mm5, %mm4 movq %mm6, 216(%esp) movq 192(%esp), %mm5 movq %mm7, %mm6 pswapd %mm5, %mm5 pxor chs_hi, %mm5 pfsub %mm5, %mm6 pfadd %mm5, %mm7 movq %mm6, 256(%esp) movq 184(%esp), %mm5 movq %mm3, %mm6 pfsub %mm0, %mm3 movq %mm7, 248(%esp) movq %mm4, %mm7 pfadd %mm5, %mm4 pfadd %mm0, %mm6 pfsub %mm5, %mm7 movq %mm4, %mm5 pfsub %mm1, %mm4 pswapd %mm6, %mm0 pfmul KP831469612KP555570233, %mm6 movq %mm7, 264(%esp) pswapd %mm3, %mm7 pfmul KP195090322KP980785280, %mm3 pfmul KP831469612KP555570233, %mm0 pfadd %mm1, %mm5 movq %mm4, 288(%esp) movq 32(%esp), %mm1 movq 48(%esp), %mm4 pfmul KP195090322KP980785280, %mm7 movq %mm6, 352(%esp) movq 16(%esp), %mm6 pswapd %mm4, %mm4 movq %mm3, 304(%esp) movq %mm0, 360(%esp) movq 8(%esp), %mm3 movq 24(%esp), %mm0 pxor chs_hi, %mm4 movq %mm5, 296(%esp) movq %mm1, %mm5 movq %mm7, 312(%esp) movq %mm6, %mm7 pfnacc %mm3, %mm6 pswapd %mm0, %mm0 pfacc %mm7, %mm3 pfadd %mm4, %mm1 pfsub %mm4, %mm5 pxor chs_lo, %mm0 movq 0(%esp), %mm4 pfmul KP707106781KP707106781, %mm6 pfmul KP707106781KP707106781, %mm3 movq %mm1, 280(%esp) movq %mm4, %mm7 pfsub %mm0, %mm4 movq %mm5, 272(%esp) pfadd %mm0, %mm7 movq 40(%esp), %mm0 movq %mm4, %mm1 pfsub %mm6, %mm4 movq %mm7, %mm5 pfadd %mm6, %mm1 pswapd %mm0, %mm0 pfadd %mm3, %mm7 movq 112(%esp), %mm6 pfsub %mm3, %mm5 movq %mm0, %mm3 movq %mm4, 344(%esp) movq %mm1, 328(%esp) movq %mm7, 336(%esp) movq 104(%esp), %mm4 pfsub %mm6, %mm3 movq 96(%esp), %mm7 pfadd %mm6, %mm0 movq %mm5, 320(%esp) movq 88(%esp), %mm6 movq %mm2, %mm5 movq %mm4, %mm1 pfacc %mm7, %mm4 pfpnacc %mm6, %mm5 pswapd %mm6, %mm6 movq %mm0, 376(%esp) pfnacc %mm1, %mm7 movq %mm3, %mm0 pfpnacc %mm2, %mm6 pfmul KP707106781KP707106781, %mm4 movq %mm5, %mm1 pfmul KP707106781KP707106781, %mm7 pfacc %mm6, %mm5 pfnacc %mm1, %mm6 pfsub %mm4, %mm3 pfmul KP707106781KP707106781, %mm5 pfadd %mm4, %mm0 movq %mm7, 368(%esp) movq 240(%esp), %mm4 movq 208(%esp), %mm7 pfmul KP707106781KP707106781, %mm6 movq %mm3, %mm2 pfmul KP555570233KP831469612, %mm3 movq %mm0, %mm1 pfmul KP195090322KP980785280, %mm0 pswapd %mm7, %mm7 pfmul KP831469612KP555570233, %mm2 movq %mm5, 384(%esp) movq %mm4, %mm5 pfmul KP980785280KP195090322, %mm1 pfsubr %mm7, %mm4 pfadd %mm7, %mm5 movq %mm6, 392(%esp) movq %mm3, 408(%esp) movq %mm4, 400(%esp) movq 80(%esp), %mm7 movq 72(%esp), %mm3 pswapd %mm7, %mm7 pswapd %mm5, %mm6 movq %mm3, %mm4 pfmul KP923879532KP382683432, %mm5 pfadd %mm7, %mm3 pfmul KP923879532KP382683432, %mm6 pfsubr %mm7, %mm4 movq %mm3, %mm7 pfmul KP923879532KP382683432, %mm3 pfmul KP382683432KP923879532, %mm7 pfpnacc %mm5, %mm3 movq 168(%esp), %mm5 pfpnacc %mm7, %mm6 movq %mm3, 424(%esp) movq 176(%esp), %mm3 pswapd %mm5, %mm7 pfmul KP382683432KP923879532, %mm5 movq %mm6, 416(%esp) pfmul KP382683432KP923879532, %mm7 movq %mm3, %mm6 pfmul KP382683432KP923879532, %mm3 pfmul KP923879532KP382683432, %mm6 pfpnacc %mm5, %mm3 pfpnacc %mm6, %mm7 movq 160(%esp), %mm6 movq %mm3, %mm5 pfnacc %mm7, %mm3 pfacc %mm5, %mm7 movq %mm6, %mm5 pfmul KP923879532KP382683432, %mm6 pfmul KP382683432KP923879532, %mm5 movq %mm3, 440(%esp) movq %mm7, 432(%esp) movq 152(%esp), %mm3 pswapd %mm3, %mm7 pfmul KP923879532KP382683432, %mm3 pfmul KP923879532KP382683432, %mm7 pfpnacc %mm3, %mm6 pfpnacc %mm5, %mm7 movq 144(%esp), %mm5 movq %mm6, %mm3 pfnacc %mm7, %mm6 pfacc %mm3, %mm7 movq %mm6, 448(%esp) movq 136(%esp), %mm3 pswapd %mm5, %mm6 movq %mm7, 536(%esp) pfpnacc %mm3, %mm6 pfpnacc %mm5, %mm3 movq 232(%esp), %mm5 movq %mm3, %mm7 pfacc %mm6, %mm3 pfnacc %mm7, %mm6 movq 216(%esp), %mm7 pfmul KP707106781KP707106781, %mm3 pfmul KP707106781KP707106781, %mm6 movq %mm3, 464(%esp) movq %mm5, %mm3 pfadd %mm7, %mm5 pfsub %mm7, %mm3 movq %mm6, 456(%esp) movq %mm5, %mm7 pfmul KP980785280KP195090322, %mm5 movq %mm3, %mm6 pfmul KP555570233KP831469612, %mm3 pfmul KP195090322KP980785280, %mm7 pfmul KP831469612KP555570233, %mm6 pfpnacc %mm0, %mm5 movq 400(%esp), %mm0 pfpnacc %mm2, %mm3 movq 408(%esp), %mm2 pfpnacc %mm7, %mm1 movq %mm4, %mm7 pfmul KP382683432KP923879532, %mm4 movq %mm5, 528(%esp) pfmul KP923879532KP382683432, %mm7 pfpnacc %mm6, %mm2 movq %mm3, 496(%esp) movq %mm1, 520(%esp) movq 376(%esp), %mm6 movq 368(%esp), %mm3 pswapd %mm0, %mm1 pfmul KP382683432KP923879532, %mm0 pfmul KP382683432KP923879532, %mm1 movq %mm6, %mm5 movq %mm2, 472(%esp) pfadd %mm3, %mm6 pfsub %mm3, %mm5 pfpnacc %mm0, %mm4 movq 360(%esp), %mm0 movq %mm6, %mm2 pfmul KP831469612KP555570233, %mm6 pfpnacc %mm7, %mm1 movq %mm5, %mm3 pfmul KP195090322KP980785280, %mm5 pfmul KP555570233KP831469612, %mm2 pfmul KP980785280KP195090322, %mm3 movq %mm4, 488(%esp) movq %mm1, 480(%esp) movq (%ebx,%esi), %mm7 movq (%ecx,%esi), %mm4 leal (%edi,%edx,8), %esi pfpnacc 352(%esp), %mm6 pfpnacc 304(%esp), %mm5 pfpnacc %mm2, %mm0 movq 312(%esp), %mm2 movq %mm4, %mm1 pfadd %mm7, %mm4 pfsub %mm7, %mm1 movq (%ecx,%ebp), %mm7 pfpnacc %mm3, %mm2 movq %mm0, 512(%esp) movq %mm6, 504(%esp) movq (%ebx,%ebp), %mm3 movq (%ecx,%edi), %mm0 leal (%edx,%edx,8), %ebp movq %mm5, 544(%esp) movq (%ebx,%edi), %mm5 leal (%ebp,%edx,8), %edi movq %mm3, %mm6 movq %mm2, 552(%esp) pfsub %mm7, %mm3 movq %mm0, %mm2 pfadd %mm7, %mm6 movq (%ebx,%esi), %mm7 pfadd %mm5, %mm0 pfsub %mm5, %mm2 movq %mm3, 560(%esp) movq (%ecx,%esi), %mm5 leal (%edi,%edx,8), %esi movq %mm7, %mm3 pfsub %mm5, %mm3 movq %mm2, 584(%esp) movq %mm6, %mm2 pfadd %mm5, %mm7 movq %mm4, %mm5 pfadd %mm0, %mm6 pfsub %mm0, %mm2 pswapd %mm3, %mm0 pfadd %mm7, %mm5 pfpnacc %mm1, %mm0 pfpnacc %mm3, %mm1 movq %mm2, 624(%esp) movq (%ebx,%edx), %mm3 pfsubr %mm7, %mm4 movq %mm6, %mm7 pfadd %mm5, %mm6 pfsub %mm5, %mm7 movq (%ecx,%edx), %mm5 movq %mm1, %mm2 pfacc %mm0, %mm1 pxor chs_lo, %mm4 pfnacc %mm2, %mm0 movq %mm6, 672(%esp) movq %mm7, 592(%esp) movq (%ecx,%ebp), %mm2 movq (%ebx,%ebp), %mm7 leal (%edx,%edx,2), %ebp pfmul KP707106781KP707106781, %mm1 movq %mm4, 608(%esp) movq %mm5, %mm4 pfsub %mm3, %mm5 pfmul KP707106781KP707106781, %mm0 movq %mm2, %mm6 pfadd %mm7, %mm2 pfsub %mm7, %mm6 movq (%ecx,%edi), %mm7 pfadd %mm3, %mm4 movq %mm5, 600(%esp) movq %mm1, 568(%esp) movq (%ebx,%edi), %mm3 movq (%ecx,%esi), %mm1 movq %mm7, %mm5 movq %mm0, 576(%esp) movq (%ebx,%esi), %mm0 pfadd %mm3, %mm7 leal (%edi,%edx,2), %esi leal (%ebp,%edx,8), %edi pfsub %mm3, %mm5 movq %mm0, %mm3 pfsub %mm1, %mm0 movq %mm5, 616(%esp) movq %mm4, %mm5 pfadd %mm1, %mm3 pfsub %mm7, %mm4 movq %mm2, %mm1 pfadd %mm7, %mm5 pswapd %mm0, %mm7 pfpnacc %mm6, %mm7 pfpnacc %mm0, %mm6 movq %mm4, 664(%esp) movq (%ebx,%esi), %mm0 pfadd %mm3, %mm2 movq %mm5, %mm4 pfsubr %mm3, %mm1 movq %mm6, %mm3 pfacc %mm7, %mm6 pfsub %mm2, %mm5 pfadd %mm2, %mm4 pxor chs_lo, %mm1 movq (%ecx,%esi), %mm2 pfnacc %mm3, %mm7 pfmul KP707106781KP707106781, %mm6 movq %mm5, 648(%esp) movq (%ecx,%ebp), %mm3 movq (%ebx,%ebp), %mm5 leal (%esi,%edx,8), %ebp movq %mm1, 656(%esp) movq %mm2, %mm1 pfadd %mm0, %mm2 pfmul KP707106781KP707106781, %mm7 movq %mm4, 680(%esp) movq %mm3, %mm4 pfsub %mm0, %mm1 movq (%ebx,%edi), %mm0 leal (%edx,%edx,4), %esi pfadd %mm5, %mm3 movq %mm2, 688(%esp) movq (%ecx,%edi), %mm2 pfsub %mm5, %mm4 movq %mm6, 640(%esp) movq (%ecx,%ebp), %mm6 leal (%edx,%esi,4), %edi pxor chs_lo, %mm1 movq %mm7, 632(%esp) movq (%ebx,%ebp), %mm7 leal (%esi,%edx,8), %ebp movq %mm2, %mm5 pfsub %mm0, %mm2 pswapd %mm4, %mm4 pfadd %mm0, %mm5 movq %mm7, %mm0 pfadd %mm6, %mm7 pxor chs_lo, %mm2 pfsub %mm6, %mm0 movq %mm7, %mm6 pfadd %mm5, %mm7 pfsub %mm5, %mm6 pswapd %mm0, %mm0 movq %mm4, %mm5 pfadd %mm1, %mm4 pfsub %mm1, %mm5 movq %mm0, %mm1 pfsub %mm2, %mm0 pfadd %mm2, %mm1 movq %mm4, 720(%esp) movq 688(%esp), %mm2 movq %mm3, %mm4 movq %mm5, 704(%esp) pswapd %mm6, %mm5 movq %mm0, 696(%esp) pfsub %mm2, %mm4 movq %mm1, 712(%esp) movq (%ebx,%esi), %mm1 pfadd %mm2, %mm3 movq (%ecx,%esi), %mm2 leal (%edi,%edx,8), %esi pfpnacc %mm4, %mm5 movq %mm3, %mm0 pfpnacc %mm6, %mm4 movq %mm2, %mm6 pfadd %mm7, %mm3 pfsub %mm7, %mm0 movq %mm5, 736(%esp) movq (%ebx,%edi), %mm7 movq (%ecx,%edi), %mm5 pfadd %mm1, %mm2 movq %mm4, 744(%esp) pfsub %mm1, %mm6 movq %mm3, 752(%esp) movq (%ebx,%ebp), %mm1 movq (%ecx,%ebp), %mm3 leal (%edx,%edx,2), %edi pxor chs_hi, %mm0 movq %mm5, %mm4 pfadd %mm7, %mm5 leal (%edx,%edi,2), %ebp pswapd %mm6, %mm6 pfsub %mm7, %mm4 movq %mm3, %mm7 movq %mm0, 728(%esp) movq (%ecx,%esi), %mm0 pfsub %mm1, %mm3 movq %mm5, 760(%esp) movq (%ebx,%esi), %mm5 pfadd %mm1, %mm7 leal (%ebp,%edx,4), %esi pxor chs_lo, %mm4 pxor chs_lo, %mm3 leal (%esi,%edx,4), %edi movq %mm5, %mm1 pfadd %mm0, %mm5 pfsub %mm0, %mm1 movq %mm5, %mm0 pfadd %mm7, %mm5 pfsub %mm7, %mm0 pswapd %mm1, %mm1 movq %mm6, %mm7 pfadd %mm4, %mm6 pfsub %mm4, %mm7 movq %mm1, %mm4 pfadd %mm3, %mm1 pfsub %mm3, %mm4 movq %mm6, 776(%esp) movq 760(%esp), %mm3 movq %mm2, %mm6 movq %mm7, 792(%esp) movq %mm1, 768(%esp) pswapd %mm0, %mm1 pfadd %mm3, %mm2 movq %mm4, 784(%esp) movq 680(%esp), %mm4 pfsub %mm3, %mm6 movq %mm2, %mm7 pfadd %mm5, %mm2 movq %mm4, %mm3 pfpnacc %mm6, %mm1 pfpnacc %mm0, %mm6 movq 672(%esp), %mm0 pfsub %mm5, %mm7 movq 752(%esp), %mm5 pfsub %mm2, %mm3 pfadd %mm2, %mm4 movq %mm0, %mm2 pfsub %mm5, %mm0 pxor chs_hi, %mm7 pfadd %mm5, %mm2 pswapd %mm0, %mm5 pfpnacc %mm3, %mm5 pfpnacc %mm0, %mm3 movq %mm4, %mm0 pfadd %mm2, %mm4 pfsubr %mm2, %mm0 movq %mm5, 800(%esp) movq %mm3, 808(%esp) movq %mm0, 816(%esp) movq 664(%esp), %mm2 movq 656(%esp), %mm5 pswapd %mm2, %mm0 movq %mm5, %mm3 pfsubr %mm0, %mm5 movq %mm6, %mm0 pfnacc %mm1, %mm6 pswapd %mm3, %mm3 pfacc %mm1, %mm0 pfadd %mm3, %mm2 movq %mm5, %mm1 pfmul KP707106781KP707106781, %mm6 pfmul KP707106781KP707106781, %mm0 movq %mm2, %mm3 pfsub %mm6, %mm1 pfadd %mm0, %mm2 pfadd %mm6, %mm5 movq 608(%esp), %mm6 pfsub %mm0, %mm3 movq %mm1, 832(%esp) movq %mm2, 840(%esp) movq %mm5, 824(%esp) movq 624(%esp), %mm0 movq 744(%esp), %mm1 movq 736(%esp), %mm2 pswapd %mm0, %mm5 movq %mm3, 848(%esp) movq %mm6, %mm3 pfsubr %mm5, %mm6 movq %mm1, %mm5 pswapd %mm3, %mm3 pfnacc %mm2, %mm1 pfacc %mm2, %mm5 pfadd %mm3, %mm0 movq %mm6, %mm2 pfmul KP707106781KP707106781, %mm1 pfmul KP707106781KP707106781, %mm5 movq %mm0, %mm3 pfsub %mm1, %mm2 pfadd %mm1, %mm6 movq 592(%esp), %mm1 pfsub %mm5, %mm0 pfadd %mm5, %mm3 movq %mm2, 864(%esp) movq 728(%esp), %mm5 movq 648(%esp), %mm2 pswapd %mm1, %mm1 movq %mm6, 856(%esp) movq %mm0, 880(%esp) movq %mm1, %mm6 pfadd %mm5, %mm1 movq %mm3, 872(%esp) pswapd %mm2, %mm2 pfsub %mm5, %mm6 movq %mm2, %mm0 pfadd %mm7, %mm2 movq %mm1, %mm3 pfmul KP923879532KP382683432, %mm1 pfsub %mm7, %mm0 pfmul KP382683432KP923879532, %mm3 movq %mm6, %mm5 movq %mm2, %mm7 pfmul KP923879532KP382683432, %mm2 pfmul KP382683432KP923879532, %mm6 pswapd %mm7, %mm7 pfmul KP923879532KP382683432, %mm5 pfmul KP923879532KP382683432, %mm7 pfpnacc %mm2, %mm1 pswapd %mm0, %mm2 pfmul KP382683432KP923879532, %mm0 pfmul KP382683432KP923879532, %mm2 pfpnacc %mm3, %mm7 movq %mm1, 888(%esp) movq 792(%esp), %mm3 pfpnacc %mm0, %mm6 movq %mm7, 896(%esp) movq 784(%esp), %mm0 movq 616(%esp), %mm7 pfpnacc %mm5, %mm2 pswapd %mm3, %mm1 pfmul KP923879532KP382683432, %mm3 movq %mm0, %mm5 pfmul KP923879532KP382683432, %mm1 movq %mm6, 904(%esp) pswapd %mm7, %mm7 pfmul KP382683432KP923879532, %mm0 movq 600(%esp), %mm6 pfmul KP923879532KP382683432, %mm5 movq %mm2, 912(%esp) pxor chs_lo, %mm7 movq %mm6, %mm2 pfadd %mm7, %mm6 pfpnacc %mm3, %mm5 movq 640(%esp), %mm3 pfpnacc %mm0, %mm1 pfsub %mm7, %mm2 movq %mm6, %mm7 pfsub %mm3, %mm6 movq %mm5, %mm0 pfnacc %mm1, %mm5 pfacc %mm1, %mm0 pfadd %mm3, %mm7 movq %mm6, %mm1 pfsub %mm5, %mm6 pfadd %mm5, %mm1 movq 768(%esp), %mm5 pswapd %mm7, %mm7 movq %mm6, 920(%esp) movq %mm7, %mm3 pfsub %mm0, %mm7 movq %mm1, 928(%esp) movq 776(%esp), %mm1 movq %mm5, %mm6 pfadd %mm0, %mm3 pfmul KP923879532KP382683432, %mm5 pfmul KP382683432KP923879532, %mm6 movq %mm7, 952(%esp) movq 632(%esp), %mm7 pswapd %mm1, %mm0 pfmul KP382683432KP923879532, %mm1 movq %mm3, 960(%esp) movq %mm2, %mm3 pfmul KP382683432KP923879532, %mm0 pfadd %mm7, %mm2 pfsub %mm7, %mm3 pfpnacc %mm1, %mm6 pswapd %mm2, %mm2 pfpnacc %mm5, %mm0 movq %mm3, %mm1 movq %mm2, %mm5 movq %mm6, %mm7 pfacc %mm0, %mm7 pfnacc %mm0, %mm6 movq 720(%esp), %mm0 pfsub %mm7, %mm5 pfadd %mm7, %mm2 movq 712(%esp), %mm7 pfsub %mm6, %mm3 pfadd %mm6, %mm1 pswapd %mm0, %mm6 movq %mm5, 936(%esp) movq 584(%esp), %mm5 pfmul KP382683432KP923879532, %mm0 movq %mm2, 944(%esp) movq %mm3, 968(%esp) movq %mm7, %mm3 pfmul KP382683432KP923879532, %mm7 pfmul KP382683432KP923879532, %mm6 movq 560(%esp), %mm2 pswapd %mm5, %mm5 pfmul KP923879532KP382683432, %mm3 pxor chs_lo, %mm5 pfpnacc %mm0, %mm7 movq %mm2, %mm0 pfsub %mm5, %mm2 pfpnacc %mm3, %mm6 movq 576(%esp), %mm3 pfadd %mm5, %mm0 movq %mm2, %mm5 pfsub %mm3, %mm2 pfadd %mm3, %mm5 movq %mm7, %mm3 pfacc %mm6, %mm7 pfnacc %mm6, %mm3 movq %mm2, %mm6 pswapd %mm5, %mm5 pfadd %mm3, %mm6 pfsub %mm3, %mm2 movq %mm5, %mm3 pfadd %mm7, %mm5 pfsub %mm7, %mm3 movq %mm2, 992(%esp) movq %mm5, 984(%esp) movq %mm3, 976(%esp) movq 704(%esp), %mm7 movq 696(%esp), %mm5 pswapd %mm7, %mm2 pfmul KP923879532KP382683432, %mm7 pfmul KP923879532KP382683432, %mm2 movq %mm5, %mm3 pfmul KP382683432KP923879532, %mm5 pfmul KP923879532KP382683432, %mm3 pfpnacc %mm5, %mm2 movq 568(%esp), %mm5 pfpnacc %mm7, %mm3 movq %mm0, %mm7 pfadd %mm5, %mm7 pfsub %mm5, %mm0 movq %mm3, %mm5 pfacc %mm2, %mm3 pfnacc %mm2, %mm5 pswapd %mm7, %mm7 movq %mm0, %mm2 pfadd %mm5, %mm2 pfsub %mm5, %mm0 movq %mm7, %mm5 pfsub %mm3, %mm7 pfadd %mm3, %mm5 movq %mm2, 1024(%esp) movq %mm0, 1000(%esp) movq %mm7, 1048(%esp) movq 296(%esp), %mm3 movq 248(%eax), %mm0 movq %mm3, %mm2 pfsub %mm4, %mm3 movq %mm5, 1056(%esp) movq 288(%esp), %mm5 pfadd %mm4, %mm2 movq 816(%esp), %mm4 pswapd %mm3, %mm7 pfmul %mm0, %mm3 pswapd %mm4, %mm4 pfmul %mm0, %mm7 movq %mm2, 1008(%esp) movq %mm5, %mm2 pxor chs_hi, %mm4 movq 120(%eax), %mm0 pfpnacc %mm7, %mm3 movq 376(%eax), %mm7 pfadd %mm4, %mm2 pfsub %mm4, %mm5 movq %mm3, 1016(%esp) pswapd %mm2, %mm4 pfmul %mm0, %mm2 pswapd %mm5, %mm3 pfmul %mm7, %mm5 pfmul %mm0, %mm4 movq %mm1, %mm0 pfmul %mm7, %mm3 pswapd %mm6, %mm7 pfmul KP773010453KP634393284, %mm1 pfmul KP773010453KP634393284, %mm6 pfpnacc %mm4, %mm2 movq 344(%esp), %mm4 pfmul KP634393284KP773010453, %mm0 pfpnacc %mm3, %mm5 movq 440(%esp), %mm3 pfmul KP773010453KP634393284, %mm7 movq %mm2, 1032(%esp) movq %mm4, %mm2 movq %mm5, 1040(%esp) movq 552(%esp), %mm5 pfsub %mm3, %mm4 pfadd %mm3, %mm2 movq 544(%esp), %mm3 pfpnacc %mm6, %mm1 pfpnacc %mm0, %mm7 movq 992(%esp), %mm0 movq %mm5, %mm6 pfacc %mm3, %mm5 movq %mm2, 1072(%esp) pfnacc %mm6, %mm3 movq 968(%esp), %mm6 pswapd %mm0, %mm2 pfmul KP098017140KP995184726, %mm0 movq %mm5, 1064(%esp) pfmul KP098017140KP995184726, %mm2 movq %mm6, %mm5 pfmul KP995184726KP098017140, %mm6 pfmul KP098017140KP995184726, %mm5 pfpnacc %mm6, %mm2 movq %mm4, %mm6 pfsub %mm3, %mm4 pfpnacc %mm0, %mm5 pfadd %mm3, %mm6 movq %mm5, %mm0 pfacc %mm2, %mm5 movq %mm6, %mm3 pfnacc %mm0, %mm2 movq %mm4, %mm0 pfadd %mm5, %mm6 pfsub %mm5, %mm3 movq %mm1, %mm5 pfadd %mm2, %mm0 pfsub %mm2, %mm4 movq %mm6, 1136(%esp) movq 1072(%esp), %mm2 movq 1064(%esp), %mm6 pfacc %mm7, %mm1 pfnacc %mm5, %mm7 movq %mm3, 1120(%esp) movq %mm0, 1080(%esp) movq %mm2, %mm5 movq %mm4, 1104(%esp) movq 336(%esp), %mm4 pfsub %mm6, %mm2 pfadd %mm6, %mm5 movq 536(%esp), %mm6 movq %mm2, %mm3 pfadd %mm7, %mm2 movq %mm5, %mm0 pfsub %mm1, %mm5 pfsub %mm7, %mm3 movq %mm4, %mm7 pfadd %mm1, %mm0 movq 960(%esp), %mm1 pfsub %mm6, %mm4 movq %mm2, 1088(%esp) movq %mm5, 1112(%esp) movq 528(%esp), %mm2 movq 1056(%esp), %mm5 pfadd %mm6, %mm7 movq %mm3, 1096(%esp) movq %mm0, 1128(%esp) movq 520(%esp), %mm0 pswapd %mm1, %mm3 movq %mm4, 1152(%esp) movq %mm2, %mm4 pfmul KP995184726KP098017140, %mm1 movq %mm5, %mm6 pfmul KP995184726KP098017140, %mm5 pfmul KP995184726KP098017140, %mm3 pfacc %mm0, %mm2 pfmul KP098017140KP995184726, %mm6 pfnacc %mm4, %mm0 movq 952(%esp), %mm4 pfpnacc %mm1, %mm5 movq %mm0, 1144(%esp) movq 1048(%esp), %mm0 pswapd %mm4, %mm1 pfpnacc %mm6, %mm3 pfmul KP634393284KP773010453, %mm4 pfmul KP634393284KP773010453, %mm1 movq %mm0, %mm6 pfmul KP773010453KP634393284, %mm0 pfmul KP634393284KP773010453, %mm6 pfpnacc %mm0, %mm1 movq %mm7, %mm0 pfadd %mm2, %mm7 pfpnacc %mm4, %mm6 movq %mm3, %mm4 pfsub %mm2, %mm0 pfacc %mm5, %mm3 pfnacc %mm4, %mm5 movq %mm7, %mm2 movq %mm0, %mm4 pfadd %mm3, %mm7 pfsub %mm3, %mm2 movq %mm1, %mm3 pfsub %mm5, %mm0 pfadd %mm5, %mm4 movq %mm7, 1208(%esp) movq 1152(%esp), %mm5 movq 1144(%esp), %mm7 pfacc %mm6, %mm1 movq %mm2, 1200(%esp) pfnacc %mm3, %mm6 movq %mm0, 1184(%esp) movq %mm5, %mm2 movq %mm4, 1160(%esp) movq 328(%esp), %mm4 pfsub %mm7, %mm5 pfadd %mm7, %mm2 movq 432(%esp), %mm7 movq %mm5, %mm3 pfadd %mm6, %mm5 movq %mm2, %mm0 pfsub %mm1, %mm2 pfsub %mm6, %mm3 movq %mm4, %mm6 pfadd %mm1, %mm0 movq 944(%esp), %mm1 pfsub %mm7, %mm4 movq %mm5, 1168(%esp) movq %mm2, 1192(%esp) movq 512(%esp), %mm5 movq 984(%esp), %mm2 pfadd %mm7, %mm6 movq %mm3, 1176(%esp) movq %mm0, 1216(%esp) movq 504(%esp), %mm0 pswapd %mm1, %mm3 movq %mm4, 1232(%esp) movq %mm5, %mm4 pfmul KP956940335KP290284677, %mm1 movq %mm2, %mm7 pfmul KP956940335KP290284677, %mm2 pfmul KP956940335KP290284677, %mm3 pfacc %mm0, %mm5 pfmul KP290284677KP956940335, %mm7 pfnacc %mm4, %mm0 movq 936(%esp), %mm4 pfpnacc %mm1, %mm2 movq %mm0, 1224(%esp) movq 976(%esp), %mm0 pswapd %mm4, %mm1 pfpnacc %mm7, %mm3 pfmul KP471396736KP881921264, %mm4 pfmul KP471396736KP881921264, %mm1 movq %mm0, %mm7 pfmul KP881921264KP471396736, %mm0 pfmul KP471396736KP881921264, %mm7 pfpnacc %mm0, %mm1 movq %mm6, %mm0 pfadd %mm5, %mm6 pfpnacc %mm4, %mm7 movq %mm3, %mm4 pfsub %mm5, %mm0 pfacc %mm2, %mm3 pfnacc %mm4, %mm2 movq %mm6, %mm5 movq %mm0, %mm4 pfadd %mm3, %mm5 pfsub %mm3, %mm6 movq %mm1, %mm3 pfsub %mm2, %mm0 pfadd %mm2, %mm4 movq %mm5, 1288(%esp) movq 1232(%esp), %mm2 movq 1224(%esp), %mm5 pfacc %mm7, %mm1 movq %mm6, 1280(%esp) pfnacc %mm3, %mm7 movq %mm0, 1264(%esp) movq %mm2, %mm6 movq %mm4, 1240(%esp) movq 320(%esp), %mm4 pfsub %mm5, %mm2 pfadd %mm5, %mm6 movq 448(%esp), %mm5 movq %mm2, %mm3 pfsub %mm7, %mm2 movq %mm6, %mm0 pfsub %mm1, %mm6 pfadd %mm7, %mm3 movq %mm4, %mm7 pfadd %mm1, %mm0 movq %mm2, 1256(%esp) movq 1024(%esp), %mm1 pfsub %mm5, %mm4 movq %mm6, 1272(%esp) movq 928(%esp), %mm6 pfadd %mm5, %mm7 movq %mm3, 1248(%esp) movq 496(%esp), %mm3 pswapd %mm1, %mm2 movq %mm0, 1296(%esp) movq 472(%esp), %mm0 pfmul KP881921264KP471396736, %mm1 pfmul KP881921264KP471396736, %mm2 movq %mm6, %mm5 movq %mm7, 1312(%esp) pfmul KP471396736KP881921264, %mm6 movq %mm3, %mm7 pfmul KP881921264KP471396736, %mm5 pfacc %mm0, %mm3 pfnacc %mm7, %mm0 movq %mm3, 1304(%esp) movq 920(%esp), %mm7 pfpnacc %mm6, %mm2 movq 1000(%esp), %mm6 movq %mm7, %mm3 pfpnacc %mm1, %mm5 pfmul KP956940335KP290284677, %mm7 pfmul KP290284677KP956940335, %mm3 pswapd %mm6, %mm1 pfmul KP290284677KP956940335, %mm6 pfmul KP290284677KP956940335, %mm1 pfpnacc %mm6, %mm3 movq %mm4, %mm6 pfsub %mm0, %mm4 pfpnacc %mm7, %mm1 pfadd %mm0, %mm6 movq %mm3, %mm7 pfacc %mm1, %mm3 pfnacc %mm7, %mm1 movq %mm6, %mm0 movq %mm4, %mm7 pfadd %mm3, %mm6 pfadd %mm1, %mm4 pfsub %mm1, %mm7 movq 1312(%esp), %mm1 pfsub %mm3, %mm0 movq %mm5, %mm3 movq %mm6, 1464(%esp) movq 1304(%esp), %mm6 pfacc %mm2, %mm5 pfnacc %mm3, %mm2 movq %mm4, 1320(%esp) movq %mm1, %mm3 movq %mm7, 1344(%esp) movq %mm0, 1376(%esp) movq 224(%esp), %mm7 pfadd %mm6, %mm3 pfsub %mm6, %mm1 movq 264(%esp), %mm6 pswapd %mm7, %mm7 movq %mm3, %mm0 pfsub %mm5, %mm3 pxor chs_hi, %mm7 movq %mm1, %mm4 pfsub %mm2, %mm1 pfadd %mm5, %mm0 movq %mm6, %mm5 pfadd %mm2, %mm4 movq %mm3, 1352(%esp) movq 808(%esp), %mm2 movq 800(%esp), %mm3 pfadd %mm7, %mm6 movq %mm1, 1336(%esp) pfsub %mm7, %mm5 movq %mm0, 1456(%esp) movq 392(%esp), %mm7 movq %mm2, %mm1 movq %mm4, 1328(%esp) pfacc %mm3, %mm2 movq %mm6, %mm0 pfnacc %mm1, %mm3 movq %mm5, %mm4 movq 256(%esp), %mm1 pfmul KP707106781KP707106781, %mm2 pfmul KP707106781KP707106781, %mm3 pfadd %mm2, %mm6 pfsub %mm2, %mm0 movq %mm1, %mm2 pfsub %mm3, %mm5 pfadd %mm3, %mm4 movq %mm6, 1416(%esp) movq 912(%esp), %mm3 movq 904(%esp), %mm6 pfadd %mm7, %mm1 movq %mm0, 1384(%esp) pfsub %mm7, %mm2 movq %mm5, 1368(%esp) movq %mm3, %mm0 movq %mm4, 1360(%esp) movq 248(%esp), %mm4 pfacc %mm6, %mm3 movq %mm1, %mm7 pfnacc %mm0, %mm6 movq %mm2, %mm5 movq 384(%esp), %mm0 pfadd %mm3, %mm1 pfsub %mm3, %mm7 movq %mm4, %mm3 pfsub %mm6, %mm2 pfadd %mm6, %mm5 movq %mm1, 1448(%esp) movq 896(%esp), %mm6 movq 888(%esp), %mm1 pfadd %mm0, %mm4 movq %mm7, 1408(%esp) pfsub %mm0, %mm3 movq %mm2, 1400(%esp) movq 880(%esp), %mm0 movq %mm6, %mm7 movq %mm5, 1392(%esp) pfacc %mm1, %mm6 movq %mm4, %mm5 pfnacc %mm7, %mm1 movq %mm3, %mm7 pswapd %mm0, %mm2 pfmul KP555570233KP831469612, %mm0 pfmul KP555570233KP831469612, %mm2 pfadd %mm6, %mm5 pfsub %mm6, %mm4 movq 848(%esp), %mm6 pfsub %mm1, %mm3 pfadd %mm1, %mm7 movq %mm6, %mm1 pfmul KP831469612KP555570233, %mm6 movq %mm4, 1440(%esp) movq %mm3, 1432(%esp) movq 424(%esp), %mm4 pfmul KP555570233KP831469612, %mm1 movq %mm7, 1424(%esp) movq 416(%esp), %mm3 movq %mm4, %mm7 pfpnacc %mm6, %mm2 movq 280(%esp), %mm6 pfnacc %mm3, %mm4 pfpnacc %mm0, %mm1 movq 464(%esp), %mm0 pfacc %mm7, %mm3 movq %mm6, %mm7 pfsub %mm0, %mm6 pfadd %mm0, %mm7 movq %mm6, %mm0 pfadd %mm4, %mm6 pfsub %mm4, %mm0 movq %mm1, %mm4 pfacc %mm2, %mm1 pfnacc %mm4, %mm2 movq %mm6, %mm4 pfsub %mm1, %mm4 pfadd %mm1, %mm6 movq %mm0, %mm1 pfsub %mm2, %mm0 pfadd %mm2, %mm1 movq %mm4, 1488(%esp) movq %mm6, 1528(%esp) movq %mm0, 1480(%esp) movq 872(%esp), %mm2 movq 840(%esp), %mm4 pswapd %mm2, %mm6 pfmul KP980785280KP195090322, %mm2 movq %mm1, 1472(%esp) movq %mm4, %mm0 pfmul KP195090322KP980785280, %mm4 movq %mm7, %mm1 pfmul KP980785280KP195090322, %mm6 pfadd %mm3, %mm7 pfmul KP980785280KP195090322, %mm0 pfsub %mm3, %mm1 pfpnacc %mm4, %mm6 movq %mm7, %mm4 pfpnacc %mm2, %mm0 movq %mm1, %mm2 movq %mm0, %mm3 pfacc %mm6, %mm0 pfnacc %mm3, %mm6 movq 832(%esp), %mm3 pfadd %mm0, %mm7 pfsub %mm0, %mm4 pfadd %mm6, %mm2 pswapd %mm3, %mm0 pfsub %mm6, %mm1 movq 864(%esp), %mm6 pfmul KP195090322KP980785280, %mm3 movq %mm7, 1520(%esp) pfmul KP195090322KP980785280, %mm0 movq %mm4, 1512(%esp) movq %mm2, 1496(%esp) movq 488(%esp), %mm4 movq 480(%esp), %mm2 movq %mm6, %mm7 pfmul KP980785280KP195090322, %mm6 movq %mm1, 1504(%esp) pfmul KP195090322KP980785280, %mm7 movq %mm4, %mm1 pfnacc %mm2, %mm4 pfacc %mm1, %mm2 movq 272(%esp), %mm1 pfpnacc %mm6, %mm0 movq 456(%esp), %mm6 pfpnacc %mm3, %mm7 movq %mm1, %mm3 pfsub %mm6, %mm1 pfadd %mm6, %mm3 movq %mm1, %mm6 pfsub %mm4, %mm1 pfadd %mm4, %mm6 movq %mm0, %mm4 pfacc %mm7, %mm0 pfnacc %mm4, %mm7 movq %mm6, %mm4 pfsub %mm0, %mm6 pfadd %mm0, %mm4 movq %mm1, %mm0 pfsub %mm7, %mm1 pfadd %mm7, %mm0 movq %mm6, 1552(%esp) movq %mm1, 1544(%esp) movq %mm0, 1536(%esp) movq 824(%esp), %mm7 movq 856(%esp), %mm1 pswapd %mm7, %mm6 pfmul KP831469612KP555570233, %mm7 pfmul KP831469612KP555570233, %mm6 movq %mm1, %mm0 pfmul KP555570233KP831469612, %mm1 pfmul KP831469612KP555570233, %mm0 pfpnacc %mm1, %mm6 movq %mm3, %mm1 pfsub %mm2, %mm3 pfpnacc %mm7, %mm0 pfadd %mm2, %mm1 movq %mm3, %mm2 movq %mm0, %mm7 pfnacc %mm6, %mm0 pfacc %mm7, %mm6 movq %mm1, %mm7 pfadd %mm0, %mm3 pfsub %mm0, %mm2 movq 24(%eax), %mm0 pfsub %mm6, %mm1 pfadd %mm6, %mm7 pswapd %mm5, %mm6 movq %mm3, 1560(%esp) movq %mm2, 1568(%esp) movq 1464(%esp), %mm3 movq 96(%eax), %mm2 pfmul %mm0, %mm5 pfmul %mm0, %mm6 movq %mm1, 1576(%esp) pswapd %mm7, %mm1 pswapd %mm3, %mm0 pfmul %mm2, %mm3 pfmul %mm2, %mm0 movq 40(%eax), %mm2 pfpnacc %mm6, %mm5 movq 1216(%esp), %mm6 pfpnacc %mm0, %mm3 pfmul %mm2, %mm7 movq 64(%eax), %mm0 pfmul %mm2, %mm1 movq %mm5, 1592(%esp) movq 1456(%esp), %mm2 pswapd %mm6, %mm5 movq %mm3, 1584(%esp) movq 32(%eax), %mm3 pfmul %mm0, %mm6 pfmul %mm0, %mm5 pfpnacc %mm1, %mm7 movq 1448(%esp), %mm0 pswapd %mm2, %mm1 pfmul %mm3, %mm2 pfmul %mm3, %mm1 pfpnacc %mm5, %mm6 movq %mm7, 1640(%esp) movq 1416(%esp), %mm5 movq 88(%eax), %mm3 pswapd %mm0, %mm7 pfpnacc %mm1, %mm2 movq 56(%eax), %mm1 pfmul %mm3, %mm0 pfmul %mm3, %mm7 movq %mm6, 1624(%esp) pswapd %mm5, %mm3 movq %mm2, 1632(%esp) movq 1208(%esp), %mm6 pfmul %mm1, %mm5 movq (%eax), %mm2 pfmul %mm1, %mm3 pfpnacc %mm7, %mm0 movq 1296(%esp), %mm7 pswapd %mm6, %mm1 pfmul %mm2, %mm6 pfmul %mm2, %mm1 pfpnacc %mm3, %mm5 movq %mm0, 1616(%esp) movq 1288(%esp), %mm0 movq 80(%eax), %mm2 pswapd %mm7, %mm3 movq %mm5, 1600(%esp) pfpnacc %mm1, %mm6 movq 16(%eax), %mm5 pfmul %mm2, %mm7 pswapd %mm0, %mm1 pfmul %mm2, %mm3 movq %mm6, 1608(%esp) movq 104(%eax), %mm2 pfmul %mm5, %mm0 pswapd %mm4, %mm6 pfmul %mm5, %mm1 movq 1136(%esp), %mm5 pfmul %mm2, %mm4 pfpnacc %mm3, %mm7 movq 112(%eax), %mm3 pfmul %mm2, %mm6 pfpnacc %mm1, %mm0 pswapd %mm5, %mm2 movq 1128(%esp), %mm1 pfmul %mm3, %mm5 pfpnacc %mm6, %mm4 pfmul %mm3, %mm2 movq 48(%eax), %mm6 pswapd %mm1, %mm3 pfmul %mm6, %mm1 pfpnacc %mm2, %mm5 movq 1528(%esp), %mm2 pfmul %mm6, %mm3 movq 72(%eax), %mm6 pfpnacc %mm3, %mm1 pswapd %mm2, %mm3 pfmul %mm6, %mm2 pfmul %mm6, %mm3 movq 8(%eax), %mm6 /* simd data load/store barrier */ movq %mm5, (%ecx,%edi) movq 1640(%esp), %mm5 leal (%edx,%edx,8), %edi movq %mm4, (%ecx,%ebp,2) movq 1616(%esp), %mm4 movq %mm1, (%ecx,%ebp) leal (%edx,%edx,2), %ebp movq 1632(%esp), %mm1 pfpnacc %mm3, %mm2 movq 1520(%esp), %mm3 movq %mm7, (%ecx,%esi) leal (%edx,%edx,4), %esi movq %mm5, (%ecx,%ebp,2) movq 1624(%esp), %mm5 movq %mm0, (%ecx,%ebp) movq 1600(%esp), %mm0 movq %mm4, (%ecx,%ebp,4) movq 1384(%esp), %mm4 leal (%edi,%edx,4), %ebp movq %mm1, (%ecx,%esi) pswapd %mm3, %mm7 movq 1584(%esp), %mm1 movq %mm2, (%ecx,%esi,2) movq 1592(%esp), %mm2 pfmul %mm6, %mm3 movq %mm5, (%ecx,%edi) pfmul %mm6, %mm7 movq %mm0, (%ecx,%edx,8) movq 1008(%esp), %mm0 movq 312(%eax), %mm5 pswapd %mm4, %mm6 movq %mm1, (%ecx,%ebp) movq 1608(%esp), %mm1 leal (%edi,%edx,2), %esi movq %mm2, (%ecx,%edx,4) movq 1376(%esp), %mm2 leal (%edx,%edx,2), %edi pfpnacc %mm7, %mm3 pfmul %mm5, %mm4 movq 352(%eax), %mm7 pfmul %mm5, %mm6 movq %mm0, (%ecx) movq 1200(%esp), %mm0 movq %mm1, (%ecx,%edx) movq 256(%eax), %mm1 leal (%edx,%edi,2), %ebp pswapd %mm2, %mm5 movq %mm3, (%ecx,%edx,2) pfmul %mm7, %mm2 pfpnacc %mm6, %mm4 pfmul %mm7, %mm5 movq 1440(%esp), %mm6 pswapd %mm0, %mm3 pfmul %mm1, %mm0 pfmul %mm1, %mm3 movq %mm4, 1648(%esp) movq 280(%eax), %mm1 pfpnacc %mm5, %mm2 pswapd %mm6, %mm7 movq 1408(%esp), %mm4 movq 344(%eax), %mm5 pfpnacc %mm3, %mm0 pfmul %mm1, %mm6 pfmul %mm1, %mm7 movq %mm2, 1664(%esp) movq 1192(%esp), %mm1 movq 320(%eax), %mm2 pswapd %mm4, %mm3 pfmul %mm5, %mm4 movq %mm0, 1656(%esp) pfmul %mm5, %mm3 movq 1352(%esp), %mm5 pfpnacc %mm7, %mm6 pswapd %mm1, %mm0 movq 288(%eax), %mm7 pfmul %mm2, %mm1 pfmul %mm2, %mm0 pfpnacc %mm3, %mm4 pswapd %mm5, %mm2 movq %mm6, 1672(%esp) movq 1576(%esp), %mm6 movq 296(%eax), %mm3 pfmul %mm7, %mm5 pfmul %mm7, %mm2 pfpnacc %mm0, %mm1 movq %mm4, 1680(%esp) movq 1488(%esp), %mm0 movq 328(%eax), %mm4 pswapd %mm6, %mm7 pfmul %mm3, %mm6 pfpnacc %mm2, %mm5 pfmul %mm3, %mm7 pswapd %mm0, %mm2 movq %mm1, 1688(%esp) movq 1280(%esp), %mm3 pfmul %mm4, %mm0 movq 272(%eax), %mm1 pfmul %mm4, %mm2 movq %mm5, 1696(%esp) movq 1120(%esp), %mm5 pfpnacc %mm7, %mm6 pswapd %mm3, %mm4 movq 368(%eax), %mm7 pfmul %mm1, %mm3 pfmul %mm1, %mm4 pfpnacc %mm2, %mm0 movq 1552(%esp), %mm2 pswapd %mm5, %mm1 movq %mm6, 1704(%esp) movq 360(%eax), %mm6 pfmul %mm7, %mm5 pfmul %mm7, %mm1 movq 1656(%esp), %mm7 pfpnacc %mm4, %mm3 pswapd %mm2, %mm4 pfmul %mm6, %mm2 pfmul %mm6, %mm4 movq 1272(%esp), %mm6 pfpnacc %mm1, %mm5 movq %mm3, (%ebx,%edi) movq 336(%eax), %mm3 leal (%edx,%edx,4), %edi movq %mm7, (%ebx,%edx) movq 1512(%esp), %mm7 movq %mm0, (%ebx,%edi,2) movq 264(%eax), %mm0 pswapd %mm6, %mm1 pfpnacc %mm4, %mm2 pfmul %mm3, %mm6 pfmul %mm3, %mm1 pswapd %mm7, %mm4 movq 1672(%esp), %mm3 pfmul %mm0, %mm7 movq %mm2, (%ebx,%ebp,2) pfmul %mm0, %mm4 movq 1696(%esp), %mm2 movq 1648(%esp), %mm0 pfpnacc %mm1, %mm6 movq 1112(%esp), %mm1 movq %mm3, (%ebx,%edx,4) movq %mm2, (%ebx,%edi) movq 304(%eax), %mm3 pfpnacc %mm4, %mm7 movq 1680(%esp), %mm4 movq %mm0, (%ebx,%edx,8) movq 1688(%esp), %mm0 pswapd %mm1, %mm2 movq %mm6, (%ebx,%esi) leal (%ebp,%edx,8), %esi pfmul %mm3, %mm1 movq 1704(%esp), %mm6 leal (%edx,%edx,2), %ebp pfmul %mm3, %mm2 movq 1664(%esp), %mm3 movq %mm5, (%ebx,%esi) movq %mm7, (%ebx,%edx,2) leal (%edx,%edx,8), %esi movq 1368(%esp), %mm7 movq 1016(%esp), %mm5 movq %mm4, (%ebx,%ebp,4) movq 440(%eax), %mm4 leal (%esi,%edx,4), %edi movq %mm0, (%ebx,%esi) pfpnacc %mm2, %mm1 movq 1184(%esp), %mm2 movq %mm6, (%ebx,%ebp,2) movq %mm3, (%ebx,%edi) movq 384(%eax), %mm6 pswapd %mm7, %mm0 movq 1344(%esp), %mm3 leal (%ebp,%edx,4), %esi movq %mm5, (%ebx) pfmul %mm4, %mm7 leal (%edx,%edi,2), %ebp leal (%edx,%edx,8), %edi pfmul %mm4, %mm0 pswapd %mm2, %mm5 movq %mm1, (%ebx,%esi) movq 480(%eax), %mm4 pfmul %mm6, %mm2 pfmul %mm6, %mm5 pswapd %mm3, %mm1 movq 1432(%esp), %mm6 pfpnacc %mm0, %mm7 pfmul %mm4, %mm3 movq 408(%eax), %mm0 pfmul %mm4, %mm1 pfpnacc %mm5, %mm2 pswapd %mm6, %mm4 movq %mm7, 1712(%esp) movq 1400(%esp), %mm5 pfmul %mm0, %mm6 movq 472(%eax), %mm7 pfmul %mm0, %mm4 pfpnacc %mm1, %mm3 movq %mm2, 1720(%esp) movq 1176(%esp), %mm0 pswapd %mm5, %mm1 movq 448(%eax), %mm2 pfmul %mm7, %mm5 pfmul %mm7, %mm1 movq %mm3, 1728(%esp) pswapd %mm0, %mm7 movq 1336(%esp), %mm3 pfpnacc %mm4, %mm6 pfmul %mm2, %mm0 movq 416(%eax), %mm4 pfmul %mm2, %mm7 pfpnacc %mm1, %mm5 movq 1568(%esp), %mm1 pswapd %mm3, %mm2 movq %mm6, 1736(%esp) movq 424(%eax), %mm6 pfmul %mm4, %mm3 pfpnacc %mm7, %mm0 pfmul %mm4, %mm2 movq %mm5, 1744(%esp) movq 1480(%esp), %mm4 pswapd %mm1, %mm7 movq 456(%eax), %mm5 pfmul %mm6, %mm1 pfmul %mm6, %mm7 movq %mm0, 1752(%esp) movq 1264(%esp), %mm0 pswapd %mm4, %mm6 pfpnacc %mm2, %mm3 movq 400(%eax), %mm2 pfmul %mm5, %mm4 pfmul %mm5, %mm6 pfpnacc %mm7, %mm1 pswapd %mm0, %mm5 movq %mm3, 1760(%esp) movq 1104(%esp), %mm7 pfmul %mm2, %mm0 movq 496(%eax), %mm3 pfmul %mm2, %mm5 pfpnacc %mm6, %mm4 movq %mm1, 1768(%esp) movq 1544(%esp), %mm6 pswapd %mm7, %mm2 movq 488(%eax), %mm1 pfmul %mm3, %mm7 pfpnacc %mm5, %mm0 pfmul %mm3, %mm2 movq 1504(%esp), %mm3 pswapd %mm6, %mm5 pfmul %mm1, %mm6 pfmul %mm1, %mm5 movq 392(%eax), %mm1 pfpnacc %mm2, %mm7 pswapd %mm3, %mm2 pfpnacc %mm5, %mm6 pfmul %mm1, %mm3 movq 1256(%esp), %mm5 pfmul %mm1, %mm2 movq 464(%eax), %mm1 pfpnacc %mm2, %mm3 pswapd %mm5, %mm2 pfmul %mm1, %mm5 pfmul %mm1, %mm2 movq 1096(%esp), %mm1 movq %mm3, (%ebx,%edi,2) movq 432(%eax), %mm3 pfpnacc %mm2, %mm5 pswapd %mm1, %mm2 pfmul %mm3, %mm1 pfmul %mm3, %mm2 movq 1768(%esp), %mm3 movq %mm5, (%ebx,%ebp) leal (%esi,%edx,8), %ebp movq 1760(%esp), %mm5 movq %mm6, (%ebx,%ebp,2) leal (%edx,%ebp,2), %esi leal (%ebp,%edx,4), %edi leal (%edx,%edx,2), %ebp movq 1752(%esp), %mm6 pfpnacc %mm2, %mm1 movq 1744(%esp), %mm2 movq %mm7, (%ebx,%esi) movq %mm0, (%ebx,%edi) leal (%edx,%ebp,4), %esi leal (%ebp,%edx,8), %edi movq 1736(%esp), %mm0 movq 1728(%esp), %mm7 movq %mm3, (%ebx,%edi,2) leal (%esi,%edx,8), %ebp leal (%edx,%edx,2), %edi movq 1040(%esp), %mm3 movq %mm4, (%ebx,%esi,2) movq %mm5, (%ebx,%ebp) leal (%ebp,%edx,4), %esi leal (%edx,%edi,2), %ebp movq 1720(%esp), %mm5 movq 1712(%esp), %mm4 movq %mm6, (%ebx,%esi) leal (%edx,%ebp,4), %edi leal (%edx,%edx,4), %esi movq 1360(%esp), %mm6 movq %mm2, (%ebx,%ebp,4) leal (%edx,%edx), %ebp movq %mm0, (%ebx,%esi,4) movq 1160(%esp), %mm0 movq 184(%eax), %mm2 leal (%edx,%ebp,8), %esi movq %mm7, (%ebx,%edi) movq %mm3, (%ebx,%ebp,8) leal (%edx,%edx,2), %edi movq 128(%eax), %mm3 leal (%edx,%edx,4), %ebp movq %mm5, (%ebx,%esi) pswapd %mm6, %mm7 movq 1320(%esp), %mm5 movq %mm4, (%ebx,%edi,8) pfmul %mm2, %mm6 pfmul %mm2, %mm7 pswapd %mm0, %mm4 leal (%edi,%ebp,4), %esi movq 224(%eax), %mm2 pfmul %mm3, %mm0 leal (%edx,%edx,8), %ebp pfmul %mm3, %mm4 movq %mm1, (%ebx,%esi) movq 1424(%esp), %mm1 pswapd %mm5, %mm3 leal (%esi,%edx,4), %edi leal (%edx,%edx,2), %esi pfpnacc %mm7, %mm6 movq 152(%eax), %mm7 pfmul %mm2, %mm5 pfmul %mm2, %mm3 pfpnacc %mm4, %mm0 movq 1392(%esp), %mm4 pswapd %mm1, %mm2 movq %mm6, 1776(%esp) pfmul %mm7, %mm1 movq 216(%eax), %mm6 pfmul %mm7, %mm2 pfpnacc %mm3, %mm5 movq %mm0, 1784(%esp) movq 1168(%esp), %mm3 pswapd %mm4, %mm7 movq 192(%eax), %mm0 pfmul %mm6, %mm4 pfmul %mm6, %mm7 pfpnacc %mm2, %mm1 movq 1328(%esp), %mm2 pswapd %mm3, %mm6 movq %mm5, 1792(%esp) movq 160(%eax), %mm5 pfmul %mm0, %mm3 pfmul %mm0, %mm6 pfpnacc %mm7, %mm4 pswapd %mm2, %mm0 movq %mm1, 1800(%esp) movq 1560(%esp), %mm7 pfmul %mm5, %mm2 movq 168(%eax), %mm1 pfmul %mm5, %mm0 movq 1472(%esp), %mm5 pfpnacc %mm6, %mm3 movq %mm4, 1808(%esp) pswapd %mm7, %mm6 movq 200(%eax), %mm4 pfmul %mm1, %mm7 pfmul %mm1, %mm6 pswapd %mm5, %mm1 movq %mm3, 1816(%esp) movq 1240(%esp), %mm3 pfpnacc %mm0, %mm2 movq 144(%eax), %mm0 pfmul %mm4, %mm5 pfmul %mm4, %mm1 pfpnacc %mm6, %mm7 movq 1080(%esp), %mm6 pswapd %mm3, %mm4 movq %mm2, 1824(%esp) movq 240(%eax), %mm2 pfmul %mm0, %mm3 pfmul %mm0, %mm4 pfpnacc %mm1, %mm5 movq %mm7, 1832(%esp) movq 1536(%esp), %mm1 pswapd %mm6, %mm0 movq 232(%eax), %mm7 pfmul %mm2, %mm6 pfmul %mm2, %mm0 pfpnacc %mm4, %mm3 pswapd %mm1, %mm2 movq 1496(%esp), %mm4 pfmul %mm7, %mm1 pfmul %mm7, %mm2 movq 136(%eax), %mm7 pfpnacc %mm0, %mm6 pswapd %mm4, %mm0 pfpnacc %mm2, %mm1 pfmul %mm7, %mm4 movq 1248(%esp), %mm2 pfmul %mm7, %mm0 movq 208(%eax), %mm7 pfpnacc %mm0, %mm4 pswapd %mm2, %mm0 pfmul %mm7, %mm2 pfmul %mm7, %mm0 movq 1088(%esp), %mm7 movq %mm4, (%ecx,%ebp,2) movq 176(%eax), %mm4 addl $504, %eax pfpnacc %mm0, %mm2 pswapd %mm7, %mm0 pfmul %mm4, %mm7 pfmul %mm4, %mm0 movq 1832(%esp), %mm4 movq %mm2, (%ecx,%edi) leal (%esi,%esi,4), %edi movq 1824(%esp), %mm2 movq %mm1, (%ecx,%edi,2) leal (%edx,%edi,2), %ebp leal (%edi,%edx,4), %esi leal (%edx,%edx,2), %edi movq 1816(%esp), %mm1 pfpnacc %mm0, %mm7 movq 1808(%esp), %mm0 movq %mm6, (%ecx,%ebp) movq %mm3, (%ecx,%esi) leal (%edx,%edi,4), %ebp leal (%edi,%edx,8), %esi movq 1800(%esp), %mm6 movq 1792(%esp), %mm3 movq %mm4, (%ecx,%esi,2) leal (%ebp,%edx,8), %edi leal (%edx,%edx,2), %esi movq 1032(%esp), %mm4 movq %mm5, (%ecx,%ebp,2) movq %mm2, (%ecx,%edi) leal (%edi,%edx,4), %ebp leal (%edx,%esi,2), %edi movq 1784(%esp), %mm5 movq 1776(%esp), %mm2 movq %mm1, (%ecx,%ebp) leal (%edx,%edi,4), %esi leal (%edx,%edx,4), %ebp movq %mm0, (%ecx,%edi,4) leal (%edx,%edx), %edi movq %mm6, (%ecx,%ebp,4) movq %mm3, (%ecx,%esi) leal (%edx,%edi,8), %ebp leal (%edx,%edx,2), %esi movq %mm4, (%ecx,%edi,8) leal (%edx,%edx,4), %edi movq %mm5, (%ecx,%ebp) leal (%esi,%edi,4), %ebp movq %mm2, (%ecx,%esi,8) movq %mm7, (%ecx,%ebp) addl 1884(%esp), %ecx addl 1884(%esp), %ebx decl 1880(%esp) jnz .L0 femms movl 1856(%esp), %ebx movl 1852(%esp), %esi movl 1848(%esp), %edi movl 1844(%esp), %ebp addl $1860, %esp ret .section .rodata nam: .string "f1k7i_64" .align 4 twinstr: .byte 4 .byte 0 .value 64 .byte 3 .byte 1 .value 0 .align 4 desc: .long 64 .long nam .long twinstr .long fftwf_kdft_ct_k7_pgenus .double 519 .double 250 .double 0 .double 0 .long 0 .long 0 .long 0 .text .align 4 .globl fftwf_codelet_f1k7i_64 fftwf_codelet_f1k7i_64: subl $12,%esp movl 16(%esp),%eax addl $-4,%esp pushl $desc pushl $f1k7i_64 pushl %eax call fftwf_kdft_dif_register addl $16,%esp addl $12,%esp ret