GENmemcpy.S 1.9 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122
  1. /* GENmemcpy.S: Generic sparc64 memcpy.
  2. *
  3. * Copyright (C) 2007 David S. Miller (davem@davemloft.net)
  4. */
  5. #ifdef __KERNEL__
  6. #define GLOBAL_SPARE %g7
  7. #else
  8. #define GLOBAL_SPARE %g5
  9. #endif
  10. #ifndef EX_LD
  11. #define EX_LD(x) x
  12. #endif
  13. #ifndef EX_ST
  14. #define EX_ST(x) x
  15. #endif
  16. #ifndef EX_RETVAL
  17. #define EX_RETVAL(x) x
  18. #endif
  19. #ifndef LOAD
  20. #define LOAD(type,addr,dest) type [addr], dest
  21. #endif
  22. #ifndef STORE
  23. #define STORE(type,src,addr) type src, [addr]
  24. #endif
  25. #ifndef FUNC_NAME
  26. #define FUNC_NAME GENmemcpy
  27. #endif
  28. #ifndef PREAMBLE
  29. #define PREAMBLE
  30. #endif
  31. #ifndef XCC
  32. #define XCC xcc
  33. #endif
  34. .register %g2,#scratch
  35. .register %g3,#scratch
  36. .text
  37. .align 64
  38. .globl FUNC_NAME
  39. .type FUNC_NAME,#function
  40. FUNC_NAME: /* %o0=dst, %o1=src, %o2=len */
  41. srlx %o2, 31, %g2
  42. cmp %g2, 0
  43. tne %XCC, 5
  44. PREAMBLE
  45. mov %o0, GLOBAL_SPARE
  46. cmp %o2, 0
  47. be,pn %XCC, 85f
  48. or %o0, %o1, %o3
  49. cmp %o2, 16
  50. blu,a,pn %XCC, 80f
  51. or %o3, %o2, %o3
  52. xor %o0, %o1, %o4
  53. andcc %o4, 0x7, %g0
  54. bne,a,pn %XCC, 90f
  55. sub %o0, %o1, %o3
  56. and %o0, 0x7, %o4
  57. sub %o4, 0x8, %o4
  58. sub %g0, %o4, %o4
  59. sub %o2, %o4, %o2
  60. 1: subcc %o4, 1, %o4
  61. EX_LD(LOAD(ldub, %o1, %g1))
  62. EX_ST(STORE(stb, %g1, %o0))
  63. add %o1, 1, %o1
  64. bne,pt %XCC, 1b
  65. add %o0, 1, %o0
  66. andn %o2, 0x7, %g1
  67. sub %o2, %g1, %o2
  68. 1: subcc %g1, 0x8, %g1
  69. EX_LD(LOAD(ldx, %o1, %g2))
  70. EX_ST(STORE(stx, %g2, %o0))
  71. add %o1, 0x8, %o1
  72. bne,pt %XCC, 1b
  73. add %o0, 0x8, %o0
  74. brz,pt %o2, 85f
  75. sub %o0, %o1, %o3
  76. ba,a,pt %XCC, 90f
  77. .align 64
  78. 80: /* 0 < len <= 16 */
  79. andcc %o3, 0x3, %g0
  80. bne,pn %XCC, 90f
  81. sub %o0, %o1, %o3
  82. 1:
  83. subcc %o2, 4, %o2
  84. EX_LD(LOAD(lduw, %o1, %g1))
  85. EX_ST(STORE(stw, %g1, %o1 + %o3))
  86. bgu,pt %XCC, 1b
  87. add %o1, 4, %o1
  88. 85: retl
  89. mov EX_RETVAL(GLOBAL_SPARE), %o0
  90. .align 32
  91. 90:
  92. subcc %o2, 1, %o2
  93. EX_LD(LOAD(ldub, %o1, %g1))
  94. EX_ST(STORE(stb, %g1, %o1 + %o3))
  95. bgu,pt %XCC, 90b
  96. add %o1, 1, %o1
  97. retl
  98. mov EX_RETVAL(GLOBAL_SPARE), %o0
  99. .size FUNC_NAME, .-FUNC_NAME